由于國家電網各類信息化系統的大規模應用,公司積累了大量的文本數據。為了挖掘其蘊含的重要價值,更好地支撐業務應用開展,需要有一套語言處理基礎軟件系統。因此,中國電力科學研究院有限公司采購九瑞的語言處理基礎軟件系統,軟件系統功能包括:
1、對非結構化文本進行分詞、詞性標注、實體識別、實體消歧、句法分析。
2、提供電力詞表管理工具。
3、提供文本信息抽取、關鍵信息抽取、實體抽取及部分關系抽取。
1、系統提供多數據源管理功能,支持txt、xml、excel和關系數據庫等類型;系統利用分布式任務調度程序可實現對數據的解析與處理功能。
2、支持對不同數據處理任務流程定義功能,每個流程節點可設置自然語言處理算法,支持對數據處理任務靈活配置功能,支持對開源算法和互聯網獨立產品組合功能,工作流工具支持在線可視化設計。
3、系統提供普通詞表和敘詞表管理功能,滿足電力詞表加工、持續更新等需求。
4、一套完善的語言處理基礎工具,提供分詞、詞性標注、實體識別、消歧、句法分析等功能。
5、基于項目文本數據,能夠實現項目關鍵信息的抽取,構建項目的標簽,其中準確率高于80%。
6、基于電力文本數據,能夠實現實體自動抽取、關系抽取等功能,提供實體及關系的可視化展示功能,其中實體抽取準確率高于75%。
合作熱線:010-58246699 轉 201