如何在C++中找到txt文件的编码？

。我是新来的C++。我必须找出文件包含的用户传递的编码类型。但我不知道如何检查文件的编码。所以我需要打印的文件是unicode或ansi或unicode big endian或utf8.I已经搜索了很多，但无法找到解决方案。到现在我已经做是我打开的文件：如何在C++中找到txt文件的编码？

#include "stdafx.h" 
#include <iostream.h> 
#include <stdio.h> 
#include<conio.h> 
#include <fstream> 
using namespace std; 



int _tmain(int argc, _TCHAR* argv[]) 
{ 
    fstream f; 
    f.open("c:\abc.txt", fstream::in | fstream::out); /* Read-write. */ 


    getch(); 
    return 0; 
}

所以请谁能告诉我的代码解决这个。

如果我正在访问记事本文件，该怎么办？

Thanx提前..

来源

2014-02-18 SRW . . .

你不能找出使用哪种编码，你只能_predict_它。您应阅读以下内容：http://www.joelonsoftware.com/articles/Unicode.html –

如果文件具有BOM，请使用BOM。如果不是，请询问用户。这是确保的唯一方法。 –

@jonathan如何检查文件中的物料清单可以请您向我解释。。 –

在这里，我已经找到一种方法来检测记事本文件，无论是Unicode，大端，UTF8或简单的ANSI文件：

我发现，当我在默认情况下在记事本中保存文件时，它存储字节标记（BOM）在文件开头。因此我决定按照此问题中的早先建议使用它。

首先我读了1个字节的文件。我已经知道， 1.如果文件是Unicode文件，那么它的前两个字符存储FE FF，即254.255是十进制等效的。 2.如果文件是UTF8文件，那么它的第一个字符存储FF和239是它的十进制等值。

这里是代码：

#include<conio.h> 
#include<stdio.h> 
#include<string.h> 
int main() 
{ 
     FILE *fp=NULL; 
     int c; 
     int a[2]; 
     int i; 
     fp=fopen("c:\\abc.txt","rb"); 

     if (fp != NULL) 
     { 
      while (i<=3) 
      { 
         c = fgetc(fp);  
         printf("%d",c); 
          if(c==254) 
          { 
           printf("Unicode Big Endian File"); 
          } 
          else if(c==255) 
          { 
           printf("Unicode Little Endian File"); 
          } 
          else if(c==239) 
          { 
           printf("UTF8 file"); 
          } 
          else 
          { 
           printf("ANSI File"); 
          } 

       } 
       fclose(fp); 

     } 


     getchar(); 

    return 0; 
}

这工作得很好了me.Hope会为别人也行。

来源

2014-02-19 06:40:36