2017-06-29 126 views
2

我试图从excel/csv文件中删除所有非ascii字符。在阅读在线和搜索后,我发现一篇文章给我的代码xlWorksheet.UsedRange.Replace("[^\\u0000-\\u007F]"删除字符,但每次,但字符仍然存在于文件中。删除非ASCII字符(使用Microsoft.Office.Interop.Excel)

而且我得到一个对话框,说明

我们无法找到任何东西来代替。点击选项查看 搜索的更多方法。

仅供参考:您试图替换的数据可能位于受保护的 工作表中。 Excel无法替换受保护工作表中的数据。

不确定如何进一步处理。我一直在网上阅读和阅读,但迄今没有发现任何有用的东西。

感谢您的帮助。

using System; 
using System.Collections.Generic; 
using System.Linq; 
using System.Runtime.InteropServices; 
using System.Text; 
using System.Threading.Tasks; 
using Excel = Microsoft.Office.Interop.Excel; 

namespace ConsoleApplication1 
{ 
    class Program 
    { 
     static void Main(string[] args) 
     { 
      Excel.Application xlApp = new Excel.Application(); 
      Excel.Workbook xlWorkbook = xlApp.Workbooks.Open(@"C:\Users\username\Desktop\Error Records.csv"); 
      Excel.Worksheet xlWorksheet = xlWorkbook.Sheets[1]; 
      Excel.Range xlRange = xlWorksheet.UsedRange; 

      int lastUsedRow = xlWorksheet.Cells.Find("*", System.Reflection.Missing.Value, 
       System.Reflection.Missing.Value, System.Reflection.Missing.Value, 
       Excel.XlSearchOrder.xlByRows, Excel.XlSearchDirection.xlPrevious, 
       false, System.Reflection.Missing.Value, System.Reflection.Missing.Value).Row; 

      int lastUsedColumn = xlWorksheet.Cells.Find("*", System.Reflection.Missing.Value, 
       System.Reflection.Missing.Value, System.Reflection.Missing.Value, 
       Excel.XlSearchOrder.xlByColumns, Excel.XlSearchDirection.xlPrevious, 
       false, System.Reflection.Missing.Value, System.Reflection.Missing.Value).Column; 

//   int lastColumnCount = lastUsedColumn; 
//; 
//   for (int i = 1; i <= lastUsedColumn; i++) 
//   { 
//    for (int j = 1; j <= lastUsedRow; j++) 
//    { 
//     xlWorksheet.Cells[j, (lastColumnCount+1)] = "Testing data 134"; 
//    } 
//   } 

      xlWorksheet.Cells[1, (lastUsedColumn + 1)] = "Title"; 
      xlWorksheet.UsedRange.Replace("[^\\u0000-\\u007F]", string.Empty); 

      xlWorkbook.Save(); 
      //cleanup 
      GC.Collect(); 
      GC.WaitForPendingFinalizers(); 

      //rule of thumb for releasing com objects: 
      // never use two dots, all COM objects must be referenced and released individually 
      // ex: [somthing].[something].[something] is bad 

      //release com objects to fully kill excel process from running in the background 
      Marshal.ReleaseComObject(xlRange); 
      Marshal.ReleaseComObject(xlWorksheet); 

      //close and release 
      xlWorkbook.SaveAs("C:\\Users\\username\\Desktop\\Errors_four.csv".Trim(), Excel.XlFileFormat.xlCSV); 
      xlWorkbook.Close(); 
      Marshal.ReleaseComObject(xlWorkbook); 

      //quit and release 
      xlApp.Quit(); 
      Marshal.ReleaseComObject(xlApp); 

     } 
    } 
} 
+0

Excel不支持Regex样式替换,因此您需要遍历每个单元格,将内容作为字符串提取并对字符串进行替换并将其分配回单元格。 – PaulF

回答

0

foreach cell在每个范围内,可以使用下面的函数来替换当前单元格的字符串值,并用ascii清理。我不知道任何excel互操作库本地的ascii转换函数。我很好奇,你有什么样的例子可以提供你正试图转换的东西吗?

请记住,有功能,然后在Excel表中有值。在你的问题中你不清楚你正在努力合作。您提到了CSV,这让我认为这些纯粹是VALUES操作。

public string ReturnCleanASCII(string s) 
{ 
    StringBuilder sb = new StringBuilder(s.Length); 
    foreach(char c in s.ToCharArray()) 
    { 
     if((int)c > 127) // you probably don't want 127 either 
      continue; 
     if((int)c < 32) // I bet you don't want control characters 
      continue; 
     if(c == ',') 
      continue; 
     if(c == '"') 
      continue; 
     sb.Append(c); 
    } 
    return sb.ToString(); 
} 

以下是一个示例用法。请记住,你需要弄清楚如何为自己编制索引,这个例子只适用于单元格1,1。此外,还有两个有用的提示:单元格是1的索引,并且,如果调用Value2而不是Value,则可能会更快。

// get the value from a cell 
string dirty = excelSheet.Cells[1, 1].Value.ToString(); // Value2 may be faster! 

// convert to clean ascii 
string clean = ReturnCleanASCII(dirty); 

// set the cell value 
excelSheet.Cells[1, 1].Value = clean; 
+0

我不知道如何将xlWorkSheet传递给字符串生成器。你能解释一下吗? – Maddy

+0

当然,请检查我的编辑。 – sapbucket

+0

谢谢你的回复。只是关于我正在实施的一个以下问题。 对(INT I = 1;我<= lastUsedRow;我++) { 对(INT J = 1;Ĵ<= lastUsedColumn; J ++){ 串 脏= xlWorksheet.Cells [I,J]。价值的ToString(); string clean = ReturnCleanASCII(dirty); xlWorksheet.Cells [i,j] .Value = clean; } } 这看起来不错吗? – Maddy