PRODUCT
CASE
SOLUTION
HONOR
JOIN US
NEWS
利用圖形圖像技術和深度學習技術,識別表格結構及表格數(shù)據(jù)內容。智能化解決文檔方向、透視角度、適度曲線及特種線條、復雜底色等復雜場景表格。
基于垂直領域的行業(yè)知識,依托OCR、自然語言處理、知識圖譜等前沿技術,構建從海量非結構化數(shù)據(jù)中提取關鍵信息的平臺,包括原生關鍵信息精準抽取、派生關鍵數(shù)據(jù)自動推理等能力。從而提升工作效率,降低人工成本,擴大數(shù)據(jù)覆蓋度及增強數(shù)據(jù)時效性。
由于PDF文檔未開放內容組織格式標準、內容讀取接口,且通過掃描形式形成的PDF,也無法利用簡單方法獲取文字內容。本公司利用PDF讀取方法、圖形圖像處理方法和光學字符識別(OCR)方法,精準高效的完成文檔內容提取和再組織任務。
光學字符識別(OCR)利用深度學習方法,在CNN和RNN的基礎上,研發(fā)改進圖片文字識別的算法體系,并將之應用于發(fā)票、行程單、的士票、收據(jù)等各類票據(jù),各類身份證件,各類銀行卡片識別場景,為金融業(yè)務提供智能化服務。
搭建多渠道、多角色、多場景、多形式的智能對話系統(tǒng),應用于智能導購、智能問答、智能檢索、智能導航以及專有業(yè)務場景多輪對話中,準確理解客戶意圖,改善人機交互模式,提升用戶操作體驗,賦能企業(yè)的服務能力升級、服務范圍升級、服務效果升級。
智能營銷平臺依托大數(shù)據(jù)、分析應用和知識圖譜模型,將多源客戶數(shù)據(jù)集成,并進行自然語言標簽化處理,從而構建客戶標簽庫、客戶畫像、客戶分群及營銷規(guī)則。在此基礎之上,同時建立標簽與營銷管理平臺互動支撐的營銷全流程管理,協(xié)助銀行金融機構實現(xiàn)以數(shù)據(jù)驅動的精準營銷模式。
采用批量裝載和實時采集形式收集并集成多源數(shù)據(jù),形成統(tǒng)一海量分析數(shù)據(jù)源,利用大數(shù)據(jù)分析方法和分析工具完成數(shù)據(jù)清洗與特征提取,最終結合機器學習模型,刻畫全息用戶風險畫像,為金融業(yè)務提供預警與防范服務。