• <li id="wwwww"></li>
    <li id="wwwww"></li>
  • <li id="wwwww"></li>
    <li id="wwwww"><tt id="wwwww"></tt></li>
    <li id="wwwww"></li>

    “垂直領域大模型論壇”分享合合信息智能文檔處理技術

    發布時間:2024-01-05 來源:中國網商務 作者:周健 責任編輯:沈曄

    近期,合合信息聯合琶洲實驗室、華南理工大學、中山大學等,共同承辦了“垂直領域大模型論壇”,匯聚高校及辦公、醫療、工業等多個行業代表性企業的技術專家,共同分享前沿技術成果與實戰思路,為大模型在垂直領域中的應用,尋找新的落腳點。

    文檔處理是垂直領域大模型的重要研究方向。受制于圖像質量低下,版式豐富,文字字體、顏色多樣等因素的影響,文檔圖像智能分析與理解能力的大幅度提升面臨著挑戰。

    合合信息智能技術平臺事業部副總經理、高級工程師丁凱博士,在此次論壇上分享,“在智能文檔處理領域,大模型支持識別和理解的文檔元素類型,遠超傳統算法,大幅度拓展了AI技術在文檔分析與識別領域的能力邊界,端到端實現了文檔從識別到理解的全過程。不足在于,目前大模型的OCR精度,距離領域最佳模型,有較大差距,長文檔依賴外部的文檔解析引擎?!倍P認為,技術公司可以把“感知”層面的事情做好,讓大模型更好地去做“認知”,這種融合研究范式,在智能文檔處理領域中,具有積極的意義。

    目前,合合信息-華南理工大學文檔圖像分析識別與理解聯合實驗室,針對大模型文檔處理中的像素級OCR統一模型、OCR大一統模型等重點技術方向,進行了深入研究,相關工作成果在文本去除、文本分割和篡改文本檢測任務上,得到了廣泛驗證。此外,實驗室還通過創新的文檔識別分析與LLM(自然語言模型)應用設計,充分利用序列預測的優勢,更好地解決文檔圖像處理中的多樣化任務需求,并且通過與LLM的結合,實現了更高層次的文檔理解和分析,為文檔圖像處理領域帶來了更多可能性。

    相關資訊

    中文 English Fran?ais Deutsch 日本語
    Русский язык Espa?ol ???? ???

    中國網客戶端

    國家重點新聞網站,9語種權威發布

    立即下載
    无码免费干干干干干