2014-11-21 51 views
2

我要寻找从ruby-gmail宝石的实例方法,让我可以读取这两种:阅读Gmail邮件与红宝石的Gmail

  • 身体 或

  • 主题

Gmail邮件。

经过审查文档,发现here,我找不到任何东西!?

Gmail::Message类节中找到了一个.message实例方法;但由于缺乏更好的术语,它只会返回给身体的电子邮件“mumbo-jumbo”。

我尝试:

#!/usr/local/bin/ruby 
require 'gmail' 

gmail = Gmail.connect('username', 'password') 

emails = gmail.inbox.emails(:from => '[email protected]') 

emails.each do |email| 
    email.read 
    email.message 
end 

现在:

  1. email.read这样做, “天书”,上面

有人提到工作

  • email.message回报其他人问这个questi在SO上,但没有得到答案。

  • +0

    你能告诉我们什么email.message回报? – pjd 2014-11-23 04:08:00

    +0

    我实际上使用了:email.html_part.body.decoded,然后Nokogiri来解析HTML!简单 – cannotcompute 2014-11-25 00:46:54

    回答

    5

    这可能不完全是你的问题的答案,但我会告诉你我过去做了什么。我尝试使用ruby-gmail gem,但它没有按照我希望它在阅读邮件方面做的事情。或者,至少,我无法实现它的工作。相反,我使用内置的Net::IMAP类来登录并获取消息。

    require 'net/imap' 
    imap = Net::IMAP.new('imap.gmail.com',993,true) 
    imap.login('<username>','<password>') 
    imap.select('INBOX') 
    subject_id = search_mail(imap, 'SUBJECT', '<mail_subject>') 
    subject_message = imap.fetch(subject_id,'RFC822')[0].attr['RFC822'] 
    mail = Mail.read_from_string subject_message 
    body_message = mail.html_part.body 
    

    从这里您的消息存储在body_message并且是HTML。如果你想要整个电子邮件正文,你可能需要学习如何使用Nokogiri来解析它。如果你只是想要知道一些周围字符的消息的一小部分,你可以使用正则表达式来找到你感兴趣的部分。

    我确实发现one page与ruby-gmail gem关联,使用ruby-gmail阅读Gmail邮件。我今天晚上进行了一次粗略的尝试,但显然谷歌加强了我帐户的安全性,而且我没法修改我的Gmail配置(根据我收到的警告邮件)而无法使用irb。所以我无法验证该页面上显示的内容,但正如我所提到的,我过去的尝试是不成熟的,而Net::IMAP适合我。

    编辑: 我发现this,这很酷。您需要添加

    require 'cgi' 
    

    给你的班级。

    我能够以这种方式实现它。我有我的body_message后,请从该链接页面html2text方法(我稍微修改及以下包括在内,因为你必须body_message转换为字符串):

    plain_text = html2text(body_message) 
    puts plain_text #Prints nicely formatted plain text to the terminal 
    

    这里是稍微修改方法:

    def html2text(html) 
        text = html.to_s. 
        gsub(/(&nbsp;|\n|\s)+/im, ' ').squeeze(' ').strip. 
        gsub(/<([^\s]+)[^>]*(src|href)=\s*(.?)([^>\s]*)\3[^>]*>\4<\/\1>/i, 
    '\4') 
    
        links = [] 
        linkregex = /<[^>]*(src|href)=\s*(.?)([^>\s]*)\2[^>]*>\s*/i 
        while linkregex.match(text) 
        links << $~[3] 
        text.sub!(linkregex, "[#{links.size}]") 
        end 
    
        text = CGI.unescapeHTML(
        text. 
         gsub(/<(script|style)[^>]*>.*<\/\1>/im, ''). 
         gsub(/<!--.*-->/m, ''). 
         gsub(/<hr(| [^>]*)>/i, "___\n"). 
         gsub(/<li(| [^>]*)>/i, "\n* "). 
         gsub(/<blockquote(| [^>]*)>/i, '> '). 
         gsub(/<(br)(| [^>]*)>/i, "\n"). 
         gsub(/<(\/h[\d]+|p)(| [^>]*)>/i, "\n\n"). 
         gsub(/<[^>]*>/, '') 
    ).lstrip.gsub(/\n[ ]+/, "\n") + "\n" 
    
        for i in (0...links.size).to_a 
        text = text + "\n [#{i+1}] <#{CGI.unescapeHTML(links[i])}>" unless 
    links[i].nil? 
        end 
        links = nil 
        text 
    end 
    

    您还在,你有天书,这一步你原来的问题提到:

    email.message *returns mumbo-jumbo* 
    

    如果天书是HTML,您可能只需使用您的现有代码与此html2text方法,而不是切换到Net::IMAP,因为我发布我的原始答案时已讨论过。

    3

    没关系,它是:

    email.subject 
    email.body 
    

    我傻

    OK,让我怎么弄身在 “可读” 的文字?没有所有的编码的东西和HTML?

    +2

    你好,请你告诉我你是如何找到这些方法的? – mickael 2015-09-03 11:56:54

    +0

    通常[RTFM](http://www.rubydoc.info/gems/gmail/Gmail/Message)。 但由于该手册相当简单: 'puts [email.message.methods - Object.new.methods] [0] .sort.inspect' – Gawin 2017-04-14 23:26:19

    2

    主题,正文和HTML正文:

    email.subject 
    
    if email.message.multipart? 
        text_body = email.message.text_part.body.decoded 
        html_body = email.message.html_part.body.decoded 
    else 
        # Only multipart messages contain a HTML body 
        text_body = email.message.body.decoded 
        html_body = text 
    end 
    

    附件:

    email.message.attachments.each do |attachment| 
        path = "/tmp/#{attachment.filename}" 
        File.write(path, attachment.decoded) 
    
        # The MIME type might be useful 
        content_type = attachment.mime_type 
    end