-1.更新
发现现在brat直接Python3就可以使用,只是brat官网上和Github上最新release版本还停留在2012年,然而brat近几年有所更新,所以我们可以直接clone Github上的brat的最新源码进行使用hhh。
0.前言
0.1 背景
近日简单调研一下NLP标注工具brat的使用,其官网示例中可以标注的任务包括命名实体识别、事件抽取、指代消解、依存句法、成分句法等等。
发现现在brat直接Python3就可以使用,只是brat官网上和Github上最新release版本还停留在2012年,然而brat近几年有所更新,所以我们可以直接clone Github上的brat的最新源码进行使用hhh。
近日简单调研一下NLP标注工具brat的使用,其官网示例中可以标注的任务包括命名实体识别、事件抽取、指代消解、依存句法、成分句法等等。
最近出于兴趣和需要,重新回顾中文分词技术,期间有些心得,以及一些关于自然语言处理的浅薄之见,这里简单分享一下。
自己开发或整合的一系列light库之间的架构组织关系如图所示:
自然语言处理(Natural Language Processing,NLP):自然语言处理是人工智能和语言学领域的分支学科,主要研究如何让计算机处理和运用自然语言。
自然语言处理广义上分为两大部分,第一部分是自然语言理解,是指让电脑“懂”人类的语言;第二部分为自然语言生成,是指把计算机数据转化为自然语言。
经过我的探索,发现现在商用也好,学习也罢,目前提供NLP技术服务的大致分三种:
今天开始探索学习使用哈工大的LTP(Language Technology Platform)。
这里是官网地址
这里是GitHub地址
这里是pyltp的使用文档
平台采用的语言是C++,但是也提供了Python和Java的封装。由于本人目前使用Python作为自然语言处理的工具语言,所以以下的探索流程都是使用本人电脑中的Window8.1操作系统的PyCharm集成开发环境,使用的Python版本是3.6。
1 / 2