Visual C# 2005 - 如何剖析內含多種格式的文字檔

摘要:Visual C# 2005 - 如何剖析內含多種格式的文字檔

一般而言,文字檔都只會內含單一種格式(比方說,以逗號分隔或是固定欄位寬度),然而文字檔卻很可能內含多種格式,當遇到此種狀況時該如何處理呢? 

如果您的文字檔內含多種格式,應該使用 TextFieldParser 物件的 PeekChars 方法去取得資料列從頭算起特定數目的字元,以便藉此來判斷該資料列的格式,然後告知 TextFieldParser 物件該資料列的格式為何並讀取該資料列。PeekChars 方法只會傳回指定數目的字元而且不會前進至下一行,透過這樣逐一判別每一筆資料列之格式並逐行讀取資料列的方式,即可夠剖析內含多種格式的文字檔並順利讀取。 

舉例來說,假設我們在應用程式專案的 Text 資料夾內含一個名稱為「多重格式文字檔.txt的文字檔,此文字檔的特殊之處在於它內含下列三種格式: 

q固定欄位寬度分別為 510  -1 的資料列。

q固定欄位寬度分別為 61017 -1 的資料列。

q採用逗號分隔的資料列。 

上述這三種格式的資料列存在一個特性,就是資料列的開頭字元分別是 CKPB SP,因此我們只要透過 TextFieldParser 物件的 PeekChars 方法取得資料列的前兩個字元,然後根據其值來設定 TextFieldType 屬性,以及設定 Delimiters 屬性(或呼叫 SetDelimiters 方法)或 FieldWidths 屬性(或呼叫 SetFieldWidths 方法),並使用 ReadFields 方法來讀取資料列。反覆使用此方式來處理每一筆資料列,就能夠順利剖析並讀取整個文字檔。 

以下的程式碼示範如何將「多重格式文字檔.txt中的三種格式資料剖析出來並分別顯示於各自的 DataGridView 控制項中。相關程式碼列示如下: 

private void CH1_DemoForm035_Load(object sender, EventArgs e)
  {
      txtResult.Text = File.ReadAllText(@"Text
多重格式文字檔.txt");

      DataGridView1.ColumnHeadersVisible = true;

      //
設定資料行標題樣式。
      DataGridViewCellStyle columnHeaderStyle = new DataGridViewCellStyle();

      columnHeaderStyle.BackColor = Color.Beige;
      columnHeaderStyle.Font = new Font("Verdana", 9, FontStyle.Bold);
      DataGridView1.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      //
設定 DataGridView 控制項的資料行數目。
      DataGridView1.ColumnCount = 3;

      //
設定各資料行的標題名稱。
      DataGridView1.Columns[0].Name = "類別編號";
      DataGridView1.Columns[1].Name = "
類別名稱";
      DataGridView1.Columns[2].Name = "
說明";

      DataGridView1.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

      DataGridView2.ColumnHeadersVisible = true;
      DataGridView2.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      //
設定 DataGridView 控制項的資料行數目。
      DataGridView2.ColumnCount = 4;

      //
設定各資料行的標題名稱。
      DataGridView2.Columns[0].Name = "產品編號";
      DataGridView2.Columns[1].Name = "
產品名稱";
      DataGridView2.Columns[2].Name = "
單位數量";
      DataGridView2.Columns[3].Name = "
單價";

      DataGridView2.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

      DataGridView3.ColumnHeadersVisible = true;
      DataGridView3.ColumnHeadersDefaultCellStyle = columnHeaderStyle;

      //
設定 DataGridView 控制項的資料行數目。
      DataGridView3.ColumnCount = 3;

 

      // 設定各資料行的標題名稱。
      DataGridView3.Columns[0].Name = "貨運公司編號";
      DataGridView3.Columns[1].Name = "
貨運公司名稱";
      DataGridView3.Columns[2].Name = "
電話";

      DataGridView3.AutoSizeColumnsMode = DataGridViewAutoSizeColumnsMode.AllCells;

  }

  private void btnParseTextFiles_Click(object sender, EventArgs e)
  {
      using (TextFieldParser myReader =
                   new TextFieldParser(@"Text多重格式文字檔.txt"))
      {
          //
定義三種格式之各欄的寬度與分隔字元。
          int[] FirstFormat = { 5, 10, -1 };
          int[] SecondFormat = { 6, 10, 17, -1 };
          string[] ThirdFormat = { "," };

          this.DataGridView1.Rows.Clear();
          this.DataGridView2.Rows.Clear();
          this.DataGridView3.Rows.Clear();

          string[] CurrentRow;

          while (!myReader.EndOfData)
          {
              try
              {
                  string RowType = myReader.PeekChars(2);

                  switch (RowType)
                  {
                      case "CK":
                          myReader.TextFieldType = FieldType.FixedWidth;
                          myReader.FieldWidths = FirstFormat;
                          //
或是myReader.SetFieldWidths(FirstFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView1.Rows.Add(CurrentRow);
                          break;
                      case "PB":
                          myReader.TextFieldType = FieldType.FixedWidth;
                          myReader.FieldWidths = SecondFormat;
                          //
或是myReader.SetFieldWidths(SecondFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView2.Rows.Add(CurrentRow);
                          break;
                      case "SP":
                          myReader.TextFieldType = FieldType.Delimited;
                          myReader.Delimiters = ThirdFormat;
                          //
或是myReader.SetDelimiters(ThirdFormat);
                          CurrentRow = myReader.ReadFields();
                          this.DataGridView3.Rows.Add(CurrentRow);
                          break;
                  }
              }
              catch (MalformedLineException ex)
              {
                  MessageBox.Show("
" + ex.Message + " 是無效的。略過。");
              }
          }

          //
排序各個 DataGridView 控制項的內容。
          DataGridView1.Sort(DataGridView1.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
          DataGridView2.Sort(DataGridView2.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
          DataGridView3.Sort(DataGridView3.Columns[0],
            System.ComponentModel.ListSortDirection.Ascending);
      }
  }

 

請注意:

欲使用 Visual Basic My 物件(或是說 My 捷徑)之前,必須先在專案中加入對 Microsoft.VisualBasic.dll 的參考,然後如下所示匯入適當的命名空間:

 

using Microsoft.VisualBasic.Devices;

 

如此一來,就可以在 Visual C#  中使用與 My 相似的語法來撰寫程式