C#Winform使用NPOI获取word中的数据

发布时间 2023-11-16 20:14:12作者: mingupupup

?公众号「DotNet学习交流」,分享学习DotNet的点滴。

需求

想要获取word里面的内容,如下图所示:

image-20231106210152965

有一张表和一段文本,并将它们存入数据库或者Excel。

步骤

添加NPOI的库,如下图所示:

image-20231106210343524

输入NPOI,如下图所示:

image-20231106210543315

选择安装

安装完成之后,需要引用NPOI.XWPF.UserModel。

在窗体上添加一个button按钮,如下图所示:

image-20231106211139220

按钮点击事件的代码如下:

 private void button1_Click(object sender, EventArgs e)
      {
           using (FileStream fs = new FileStream("你的文件路径", FileMode.Open, FileAccess.Read))
          {
               XWPFDocument doc = new XWPFDocument(fs);
               var text = doc.Paragraphs[0].Text;
               XWPFTable table = doc.Tables[0];
               foreach (var row in table.Rows)
              {
                   Debug.WriteLine("Row:");
                   foreach (var cell in row.GetTableCells())
                  {
                       string cellText = cell.GetText();
                       Debug.WriteLine("Cell Text: " + cellText);
                  }
              }
          }
      }

其中 using (FileStream fs = new FileStream("你的文件路径", FileMode.Open, FileAccess.Read))中第一个参数为word文件路径,第二个参数为文件模式,第三个参数为文件权限。

运行的结果,如下图所示:

image-20231106211921407

查看doc,如下图所示:

image-20231106212104438

可以发现整个文档,有两个元素。

其实第一个元素是一个表,如下图所示:

image-20231106212300487

总共有14行。

另一个元素是段落,如下图所示:

image-20231107091308219

表的文本内容如下所示:

image-20231107091402442

段落的文本内容如下:

image-20231107091645913

确定了doc中有我们需要的内容,现在是想着怎么把内容提取出来。

我的方案是建一个实体类,将数据导入到实体类中,修改之后的代码如下所示:

using NPOI.SS.UserModel;
using NPOI.XWPF.UserModel;
using System.Diagnostics;
using System.IO;
namespace WordDemo
{
   //创建一个需要的数据类
   public class WaterData
  {
       public string? name { get; set; }
       public string? date { get; set; }
       public string? wl { get; set; }
       public string? fr { get; set; }
       public string? source { get; set; }
  }

   public partial class Form1 : Form
  {
       //创建一个WaterData对象列表
       List<WaterData> WaterDataList = new List<WaterData>();
       public Form1()
      {
           InitializeComponent();
      }

       private void Form1_Load(object sender, EventArgs e)
      {

      }

       private void button1_Click(object sender, EventArgs e)
      {
           using (FileStream fs = new FileStream("你的文件路径", FileMode.Open, FileAccess.Read))
          {
               XWPFDocument doc = new XWPFDocument(fs);
               var text = doc.Paragraphs[0].Text;
               XWPFTable table = doc.Tables[0];
               for (int i = 1; i < table.Rows.Count; i++)
              {
                   var waterData = new WaterData();
                   var tableCells = table.Rows[i].GetTableCells();
                   waterData.name = tableCells[0].GetText();
                   waterData.date = tableCells[1].GetText();
                   waterData.wl = tableCells[2].GetText();
                   waterData.fr = tableCells[3].GetText();
                   waterData.source = text;
                   WaterDataList.Add(waterData);
              }

          }
      }
  }
}

运行之后,WaterDataList中的内容如下所示:

image-20231107092156795

实现了我们的需求,现在可以将WaterDataList中的内容存入数据库或者Excel了。