漢王科技張娜榮獲中央檔案館國家檔案局“全國檔案工匠型人才”稱號
自國家檔案局印發《關于做好國家級檔案專家、全國檔案工匠型人才和全國青年檔案業務骨干選拔工作的通知》以來,全國檔案系統統一部署“三支人才隊伍”選拔工作。漢王科技滿文檔案圖像識別軟件的開發與應用項目研發負責人張娜榮獲中央檔案館國家檔案局頒發的“全國檔案工匠型人才”稱號。
以上人才選拔工作以習近平總書記關于檔案工作和人才工作重要指示批示精神為指導,以“十四五”時期檔案事業發展對人才的需求為導向,以建設結構合理、數量充足的人才隊伍為目標,不斷加快檔案系統人才隊伍建設,遴選為檔案事業發展作出突出貢獻的專家、具有工匠精神的技能型檔案人才、青年檔案業務骨干,建設一支高素質檔案專家隊伍和高技能人才隊伍,推動檔案事業戰略研究、政策研究、理論研究向縱深發展,促進檔案技能人才隊伍專業化水平提升,挖掘和培養一批具有引領作用的青年業務骨干,為檔案事業發展提供決策支持和人才支撐,開啟新時代人才強檔工程。
漢王科技在古漢語數字化應用領域擁有深厚積累,以OCR識別、NLP等人工智能技術構建了知識采集、服務、管理為一體的智慧古文平臺,服務國家圖書館、上海圖書館等30+大型綜合類圖書館,故宮博物院、中國社會科學院等20+知名專業類人文院所,已成功完成了《水經注》《明宮詞》、滿文朱批奏折、藏文古籍以及大量的方志等數字化應用。
通過多年的行業積累,漢王在此基礎上推出了漢王天地大模型之古漢語大模型,該模型具備優秀的知識問答、古文創作、古文翻譯、摘要提取以及結構化信息抽取等能力,在古文問答、古文生成、古文翻譯等場景應用中不斷推進文化數字化建設,并最終為智能化社會賦能。
以上人才選拔工作以習近平總書記關于檔案工作和人才工作重要指示批示精神為指導,以“十四五”時期檔案事業發展對人才的需求為導向,以建設結構合理、數量充足的人才隊伍為目標,不斷加快檔案系統人才隊伍建設,遴選為檔案事業發展作出突出貢獻的專家、具有工匠精神的技能型檔案人才、青年檔案業務骨干,建設一支高素質檔案專家隊伍和高技能人才隊伍,推動檔案事業戰略研究、政策研究、理論研究向縱深發展,促進檔案技能人才隊伍專業化水平提升,挖掘和培養一批具有引領作用的青年業務骨干,為檔案事業發展提供決策支持和人才支撐,開啟新時代人才強檔工程。
張娜2010年畢業于南開大學,獲得工科博士學位。同年加入漢王科技,負責公司中英文、滿文、古籍等的文字識別算法研發工作。其主導研發的“滿文檔案圖像識別軟件的開發與應用項目”為中國第一歷史檔案館與漢王科技合作開展的國家檔案局科技項目,該項研究成果填補了滿文檔案信息化和數字化領域的技術和軟件空白,突破實現了國內少數民族文字圖像手寫體識別,有助于提高滿文檔案數字化加工效率,最大程度地滿足社會公眾對滿文檔案的利用需求,具有極高的推廣價值。該項研究成果成功應用于滿文檔案全文檢索數據庫建設工作,并榮獲國家檔案局優秀科技成果特等獎。
在滿文文字識別算法研發工作的初期,張娜采用了基于動態規劃技術的識別框架。隨著深度學習技術的不斷發展和成熟,她決定將卷積神經網絡技術應用于滿文文字識別。通過這種方式,她成功地提高了滿文草書書寫檔案的文字識別率,使其達到了90%以上。
此外,張娜還主導研發了一種古籍識別算法。識別文字的同時,可以自動判斷古籍中的正文與夾注,并將文字按照正確的順序進行排序。這樣,輸出的結果就能夠為閱讀者帶來良好的閱讀體驗。
漢王科技在古漢語數字化應用領域擁有深厚積累,以OCR識別、NLP等人工智能技術構建了知識采集、服務、管理為一體的智慧古文平臺,服務國家圖書館、上海圖書館等30+大型綜合類圖書館,故宮博物院、中國社會科學院等20+知名專業類人文院所,已成功完成了《水經注》《明宮詞》、滿文朱批奏折、藏文古籍以及大量的方志等數字化應用。
通過多年的行業積累,漢王在此基礎上推出了漢王天地大模型之古漢語大模型,該模型具備優秀的知識問答、古文創作、古文翻譯、摘要提取以及結構化信息抽取等能力,在古文問答、古文生成、古文翻譯等場景應用中不斷推進文化數字化建設,并最終為智能化社會賦能。