2008-12-10 27 views
0

这里的问题是:MSSQL处理线返回而笨拙

,供大家参考:1,2和3使用Jython 2.2.1使用jdbc1.2取得

http://i.stack.imgur.com/mmrNH.jpg

数据库条目。 数据库入口4是用vb做成的,用odbc替换程序。

我们发现,如果我直接从该SQL Server企业管理器软件复制并粘贴jython和vb MailBody条目到wordpad,它将以完全正确的线返回格式输出格式。如果我将每个文件的字节与十六进制编辑器或KDiff3进行比较,则它们的二进制完全相同。

有一个第三方程序使用这些数据。令人遗憾的是,第三方程序读取数据,并且对于条目1至3,它显示没有线返回的数据。尽管对于条目4,它正确地格式化文本。作为我们可以在图片中看到的进一步证明,数据库中的数据显示方式不同。 不知怎的,行返回保存在数据库中的vb条目,但它们被忽略的jython条目。如果我点击条目4的'MailBody'字段,我可以按下我可以看到电子邮件的其余部分。而jython的数据显示在一行中。

什么给,我错过了什么,以及如何处理? 这是我实际发送给数据库的代码片段。编辑:供参考:请忽略'已处理'栏中的差异,这是无关紧要的。 编辑:我想要做的就是让jython程序以与vb程序相同的方式输入数据。这样第三方程序就会出现并正确显示数据。 所以它看起来像是'MailBody'中的每个条目都会显示“This is a testing only!”然后下一行“等等等等”,所以如果我是做一个screendump所有条目将类似于数据库条目4.

解决

添加_force_CRLF进来:

def _force_CRLF(self, data): 
    '''Make sure data uses CRLF for line termination. 
    Nicked the regex from smtplib.quotedata. ''' 
    print data 
    newdata = re.sub(r'(?:\r\n|\n|\r(?!\n))', "\r\n", data) 
    print newdata 
    return newdata 

def _execute_insert(self): 
    try: 
     self._stmt=self._con.prepareStatement(\ 
      "INSERT INTO EmailHdr (EntryID, MailSubject, MailFrom, MailTo, MailReceive, MailSent, AttachNo, MailBody)\ 
      VALUES (?, ?, ?, ?, ?, ?, ?, cast(? as varchar (" + str(BODY_FIELD_DATABASE) + ")))") 
     self._stmt.setString(1,self._emailEntryId) 
     self._stmt.setString(2,self._subject) 
     self._stmt.setString(3,self._fromWho) 
     self._stmt.setString(4,self._toWho) 
     self._stmt.setString(5,self._format_date(self._emailRecv)) 
     self._stmt.setString(6,self._format_date(self._emailSent)) 
     self._stmt.setString(7,str(self._attachmentCount)) 
     self._stmt.setString(8,self._force_CRLF(self._format_email_body())) 
     self._stmt.execute() 
     self._prepare_inserting_attachment_data() 
     self._insert_attachment_data() 
    except: 
     raise 

def _format_email_body(self): 
    if not self._emailBody: 
     return "could not extract email body" 
    if len(self._emailBody) > BODY_TRUNCATE_LENGTH: 
     return self._clean_body(self._emailBody[:BODY_TRUNCATE_LENGTH]) 
    else: 
     return self._clean_body(self._emailBody) 

def _clean_body(self,dirty): 
    '''this method simply deletes any occurrence of an '=20' that plagues my output after much testing this is not related to the line return issue, even if i comment it out I still have the problem.''' 
    dirty=str(dirty) 
    dirty=dirty.replace(r"=20","") 
    return r"%s"%dirty 
+0

请不要添加“编辑解决”。请将您的解决方案作为答案发布或结束问题。编辑解决困惑。 – 2008-12-10 11:07:10

回答

1

我建议添加一个调试输出到您的程序,在插入数据库之前转储字符代码。 Jython有可能用单个字符替换CrLf对,并且在写入数据库时​​不会恢复它。

+0

当我输出调试信息时,有正确的格式。 请注意这个http://mail.python.org/pipermail/spambayes/2003-April/004477.html任何连接? – Setori 2008-12-10 05:43:18

+0

正确的人!太好了! – Setori 2008-12-10 05:49:11

1

你应该看看quopri模块(和其他有关的电子邮件),所以你不必使用肮脏的把戏,_clean_body