本項目立足于提高數字產品建設智能化的要求,通過建設一套高度自動化的知識分析系統來實現內容資源向知識資源的轉化,進而推進產品建設。該系統從原始文本語料著手,分析資源的特性和特征,并以此為基礎通過詞表建設工具來半自動地生成符合出版社資源實際分布規律的“社會科學領域詞表”。在詞表建設的基礎上,系統將進一步利用自然語言處理、機器學習手段來對更大粒度的資源進行知識化處理,作為相關知識服務的數據基礎。建設好的系統將通過相關接口來支撐數字產品的語義環境和知識服務業務,并實現迭代優化。
1、詞表建設子系統參考主題詞表構建的方法和相關標準,為出版社提供專業詞表構建所需的建設工具。詞表建設子系統支持詞表的編寫、審核和發布,實現詞表的錄入、自動構建、擴展、維護、詞間關系控制、查詢、可視化顯示、輸出及在線發布等功能。
2、知識挖掘子系統主要負責在內容資源內部進行知識信息挖掘,通過關鍵詞抽取、自動標引、文本分類、關聯關系發現來建設基于知識關聯的知識庫,知識庫成果既可以作為詞表建設子系統的信息來源,又可以通過發布到其他業務系統來支持知識服務相關功能。
合作熱線:010-58246699 轉 201