这可能不完全是你的问题的答案,但我会告诉你我过去做了什么。我尝试使用ruby-gmail gem,但它没有按照我希望它在阅读邮件方面做的事情。或者,至少,我无法实现它的工作。相反,我使用内置的Net::IMAP
类来登录并获取消息。
require 'net/imap'
imap = Net::IMAP.new('imap.gmail.com',993,true)
imap.login('<username>','<password>')
imap.select('INBOX')
subject_id = search_mail(imap, 'SUBJECT', '<mail_subject>')
subject_message = imap.fetch(subject_id,'RFC822')[0].attr['RFC822']
mail = Mail.read_from_string subject_message
body_message = mail.html_part.body
从这里您的消息存储在body_message
并且是HTML。如果你想要整个电子邮件正文,你可能需要学习如何使用Nokogiri来解析它。如果你只是想要知道一些周围字符的消息的一小部分,你可以使用正则表达式来找到你感兴趣的部分。
我确实发现one page与ruby-gmail gem关联,使用ruby-gmail阅读Gmail邮件。我今天晚上进行了一次粗略的尝试,但显然谷歌加强了我帐户的安全性,而且我没法修改我的Gmail配置(根据我收到的警告邮件)而无法使用irb。所以我无法验证该页面上显示的内容,但正如我所提到的,我过去的尝试是不成熟的,而Net::IMAP
适合我。
编辑: 我发现this,这很酷。您需要添加
require 'cgi'
给你的班级。
我能够以这种方式实现它。我有我的body_message
后,请从该链接页面html2text
方法(我稍微修改及以下包括在内,因为你必须body_message转换为字符串):
plain_text = html2text(body_message)
puts plain_text #Prints nicely formatted plain text to the terminal
这里是稍微修改方法:
def html2text(html)
text = html.to_s.
gsub(/( |\n|\s)+/im, ' ').squeeze(' ').strip.
gsub(/<([^\s]+)[^>]*(src|href)=\s*(.?)([^>\s]*)\3[^>]*>\4<\/\1>/i,
'\4')
links = []
linkregex = /<[^>]*(src|href)=\s*(.?)([^>\s]*)\2[^>]*>\s*/i
while linkregex.match(text)
links << $~[3]
text.sub!(linkregex, "[#{links.size}]")
end
text = CGI.unescapeHTML(
text.
gsub(/<(script|style)[^>]*>.*<\/\1>/im, '').
gsub(/<!--.*-->/m, '').
gsub(/<hr(| [^>]*)>/i, "___\n").
gsub(/<li(| [^>]*)>/i, "\n* ").
gsub(/<blockquote(| [^>]*)>/i, '> ').
gsub(/<(br)(| [^>]*)>/i, "\n").
gsub(/<(\/h[\d]+|p)(| [^>]*)>/i, "\n\n").
gsub(/<[^>]*>/, '')
).lstrip.gsub(/\n[ ]+/, "\n") + "\n"
for i in (0...links.size).to_a
text = text + "\n [#{i+1}] <#{CGI.unescapeHTML(links[i])}>" unless
links[i].nil?
end
links = nil
text
end
您还在,你有天书,这一步你原来的问题提到:
email.message *returns mumbo-jumbo*
如果天书是HTML,您可能只需使用您的现有代码与此html2text方法,而不是切换到Net::IMAP
,因为我发布我的原始答案时已讨论过。
来源
2014-11-21 04:55:50
pjd
你能告诉我们什么email.message回报? – pjd 2014-11-23 04:08:00
我实际上使用了:email.html_part.body.decoded,然后Nokogiri来解析HTML!简单 – cannotcompute 2014-11-25 00:46:54