半岛权威十大直营(官方)网站

Word控件Spire.Doc 【文本】教程(18) ;如何在C#中获取word文档中的文本

翻译|使用教程|编辑:胡涛|2022-08-30 10:42:23.883|阅读 165 次

概述:本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。

# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>

相关链接:

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转换和打印Word/PDF/Excel等格式文件处理,小巧便捷。

Spire.Doc for.NET 最新下载

有时我们在处理信息量很大的word文档时,只需要从word文档中获取文本以供其他使用。在 Spire.Doc 的帮助下,我们已经演示了如何通过遍历 word 文档中的每个段落然后相应地附加文本来从 word 文档中提取文本。本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。

首先,查看将首先提取文本的示例word文档:

C#如何从word文档中获取文本

第 1 步:创建一个 word 实例并从文件中加载源 word 文档。

Document doc = new Document();
doc.LoadFromFile("Sample.docx");

第 2 步:调用 doc.GetText() 方法从 word 文档中获取所有文本。

string s = doc.GetText();

第 3 步:创建一个新的 TEXT 文件以保存提取的文本。

File.WriteAllText("Extract.txt", s.ToString());

从word文档中获取所有文本后的有效截图:

C#如何从word文档中获取文本

完整代码:

using Spire.Doc;
using System.IO;
namespace GetText
{
class WordText
{
public void GetText()
{
Document doc = new Document();
doc.LoadFromFile("Sample.docx");

string s = doc.GetText();

File.WriteAllText("Extract.txt", s.ToString());

}
}
}

以上便是如何在C#中获取word文档中的文本,如果您有其他问题也可以继续浏览本系列文章,获取相关教程,你还可以给我留言或者加入我们的官方技术交流群。


欢迎下载|体验更多E-iceblue产品

获取更多信息请咨询  ;技术交流Q群(767755948)


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@wqylolg.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关产品
Spire.Doc for .NET

Spire.Doc for .NET 是一款专门对 Word 文档进行操作的 .NET 类库。

Spire.XLS for .NET

Spire.XLS for .NET是专业.NET Excel组件,快速完成对Excel各类编程操作

Spire.Office for .NET

专业的.NET Office套件,涵盖office文档创建、编辑、转换、管理和OCR内容识别等操作

Aspose.Words for .NET

无需Microsoft Word也可在任何平台上满足Word文档的一切操作需求。

Aspose.PDF for .NET

PDF文档创建组件,无需Adobe Acrobat,也可以在任何平台上操作PDF文档。

title
title
title
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP