近期在廈門舉行的2023年中國模式識別與計算機視覺大會(PRCV),是國內模式識別和計算機視覺領域的學術盛會,參會人員包括清華大學、廈門大學、浙江大學、華中科技大學等高校的科研工作者,以及騰訊、美團、合合信息等科技企業的技術專家。本次大會解讀、分享中國模式識別與計算機視覺領域的最新理論和技術成果,進一步加強產學研領域的學術交流和技術碰撞,促進模式識別與計算機視覺領域的協同合作與融合創新。
在《視言碰撞:語言模型與視覺生態協同論壇》上,合合信息圖像算法研發總監郭豐俊博士表示,多模態技術可充分利用文檔圖像的視覺和語言屬性,并借助語言大模型已取得的優異性能和技術積累,正逐漸成為文檔圖像處理領域的熱門研究方向。
郭豐俊提到,合合信息-華南理工大學文檔圖像分析識別與理解聯合實驗室,在數據高效利用及垂直領域識別項目中取得了階段性成果。
據介紹,針對圖片生成式造假,合合信息基于空域與頻域關系建模,利用多維度特征,來分辨真實圖片和生成式圖片的細微差異,判斷圖片是否由AI生成。
今年8月,合合信息獲得了文檔分析與識別國際會議(ICDAR 2023)“文本篡改檢測”賽道冠軍。合合信息技術團隊提出的方案,能夠在保持低誤檢率的同時,準確識別并定位圖片中文本的篡改行為,從而有效保障文本信息的真實性。相關方案已在銀行、證券、保險多個場景中應用。
合合信息已聯合中國信通院,發起了《文本圖像篡改檢測系統技術規范》標準制定,希望持續推動AI技術在圖像安全領域的廣泛應用,帶給用戶更加安全、高效的工作和生活體驗。(合合信息供圖)