Hibernate/JPA import.sql utf8字符损坏

我使用import.sql将我的开发数据写入数据库。我使用的MySQL Server 5.5和我的persistence.xml是在这里：Hibernate/JPA import.sql utf8字符损坏

<?xml version="1.0" encoding="UTF-8"?> 
<persistence version="2.0" 
xmlns="http://java.sun.com/xml/ns/persistence" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://java.sun.com/xml/ns/persistence http://java.sun.com/xml/ns/persistence/persistence_2_0.xsd"> 
<persistence-unit name="MobilHM" transaction-type="RESOURCE_LOCAL"> 
    <provider>org.hibernate.ejb.HibernatePersistence</provider> 
    <class>tr.com.stigma.db.entity.Doctor</class> 
    <class>tr.com.stigma.db.entity.Patient</class> 
    <class>tr.com.stigma.db.entity.Record</class> 
    <class>tr.com.stigma.db.entity.User</class> 
    <properties> 
     <property name="hibernate.hbm2ddl.auto" value="create" /> 
     <property name="hibernate.show_sql" value="true" /> 
     <property name="hibernate.format_sql" value="true" /> 
     <!-- Auto detect annotation model classes --> 
     <property name="hibernate.archive.autodetection" value="class" /> 
     <!-- Datasource --> 
     <property name="hibernate.connection.driver_class" value="com.mysql.jdbc.Driver" /> 
     <property name="hibernate.connection.username" value="mobilhm" /> 
     <property name="hibernate.connection.password" value="mobilhm" /> 
     <property name="hibernate.connection.url" value="jdbc:mysql://localhost/mobilhm" /> 
     <property name="hibernate.dialect" value="org.hibernate.dialect.MySQLDialect" /> 
    </properties> 
</persistence-unit>

某些字符在我import.sql没有在DB正确显示。例如，字符ü变成以db为单位。在MySQL默认字符集是UTF-8，我创建表像

CREATE TABLE doctor (doctorId int unsigned NOT NULL AUTO_INCREMENT, name varchar(45) NOT NULL, surname varchar(45) NOT NULL, PRIMARY KEY (doctorId)) ENGINE=InnoDB DEFAULT CHARSET=utf8;

这是奇怪的，如果我输入使用MySQL导入/导出管理器数据是正确的，但使用hibernate.hbm2ddl.auto =创建使得乱码。

我该如何解决这个问题？

编辑：还有我尝试添加

<property name="hibernate.connection.useUnicode" value="true" /> 
<property name="hibernate.connection.characterEncoding" 
      value="UTF-8" /> 
<property name="hibernate.connection.charSet" value="UTF-8" />

到persistence.xml中。但它没有帮助。

修复：我最终解决了它。我使用的是Tomcat，这是不是休眠或者mysql的腐败点。我已经开始设置JAVA_OPTS = -Dfile.encoding = UTF-8命令，我的问题消失了。

问题的标题现在变得令人误解。对不起。

来源

2012-01-23 GokcenG

为该文件创建阅读器时，Hibernate直接使用new InputStreamReader(stream);，而没有显式编码（假设/使用默认的执行平台charset编码）。

因此，换句话说，您的import.sql文件必须在默认执行平台字符集编码。

有一个古老的（2006）开放式问题对于这一点，万一有希望发送补丁：https://hibernate.atlassian.net/browse/HBX-711

选项来解决：

添加-Dfile.encoding=UTF-8到JAVA_OPTS环境变量，如：

# Linux/Unix 
export JAVA_OPTS=-Dfile.encoding=UTF-8 
# Windows 
set JAVA_OPTS=-Dfile.encoding=UTF-8 

# Attention, check before if your JAVA_OPTS doesnt already have a value. If so, 
# then it should be 
export JAVA_OPTS=$JAVA_OPTS -Dfile.encoding=UTF-8 
# or 
set JAVA_OPTS=%JAVA_OPTS% -Dfile.encoding=UTF-8

在您的Maven插件中设置一个属性（可能是surefire,failsafe或其他，取决于您如何运行导入休眠文件的代码）。举例surefire：

<plugin> 
    <groupId>org.apache.maven.plugins</groupId> 
    <artifactId>maven-surefire-plugin</artifactId> 
    <configuration> 
     <argLine>-Dfile.encoding=UTF8</argLine> 
    </configuration> 
</plugin>

来源

2013-02-28 18:44:53 acdcjunior

+1由于正确的原因，但假设是不正确的，因为那么你的测试将是平台相关的。如果使用Maven作为@Jaroslav Frolikov已经说过，最简单的解决方案是将文本文件编码设置为IDE中的“UTF-8”或“ -Dfile.encoding = UTF8”。 –

它在2017年仍然不起作用 – gstackoverflow

我使用import.sql填充在测试阶段的数据库和该链接已经帮我解决编码的问题：http://javacimrman.blogspot.ru/2011/07/hibernate-importsql-encoding-when.html。

来源

2014-04-22 09:03:21

这是可靠解决方案，无需设置任何系统属性。

我们假设导入文件使用UTF-8编码，但Java默认字符集不同，比如说latin1。

1）定义的自定义类为import_files_sql_extractor hibernate.hbm2ddl.import_files_sql_extractor = com.pragmasphere.hibernate.CustomSqlExtractor

2）固定由休眠在执行读出的无效的字符串。

package com.pragmasphere.hibernate; 

import org.hibernate.tool.hbm2ddl.MultipleLinesSqlCommandExtractor; 

import java.io.IOError; 
import java.io.Reader; 
import java.io.UnsupportedEncodingException; 
import java.nio.charset.Charset; 

public class CustomSqlExtractor extends MultipleLinesSqlCommandExtractor { 

    private final String SOURCE_CHARSET = "UTF-8"; 

    @Override 
    public String[] extractCommands(final Reader reader) { 
     String[] lines = super.extractCommands(reader); 

     Charset charset = Charset.defaultCharset(); 
     if (!charset.equals(Charset.forName(SOURCE_CHARSET))) { 
      for (int i = 0; i < lines.length; i++) { 
       try { 
        lines[i] = new String(lines[i].getBytes(), SOURCE_CHARSET); 
       } catch (UnsupportedEncodingException e) { 
        throw new IOError(e); 
       } 
      } 
     } 

     return lines; 
    } 
}

您可以通过导入文件中使用的另一种编码改变SOURCE_CHARSET值。

来源

2016-02-11 16:14:40 Toilal

Hibernate/JPA import.sql utf8字符损坏

回答

相关问题