企業從不同渠道,接收及儲存大量非結構化數據;例如客戶申請表、報價單、產品介紹等。以往靠人工閱讀和分類歸檔,再轉化為結構式數據,除了沒效率也易出錯。因此如何擷取非結構化資料的內容,可說是企業數位化的最後一里。有了精確和快速的數據輸入,系統的結論才具意義,文件全面數位化之後,才能產生更大綜效。
OpenText是全球企業內容管理 (ECM: Enterprise Content Management)領導廠商。而OpenText Capture Center (OCC)具有專業級圖檔化文字辨識技術,能自動閱讀各類文件,擷取內容作分類上載至資料庫,方便企業內部系統利用。
OCC精準擷取重要數據
自動內容識別解決方案最困難的地方是從不同格式、充滿摺痕或污點的單據中識別有用資料並準確擷取,因為實體單據圖檔轉化為數據的準確度易受紙本的紙質、整潔度及光度等所影響。
而 OpenText Capture Center在OCR(Optical character recognition)、ICR(Intelligent character recognition)及IDR(Intelligent document recognition)等數位資料辦識技術上的強大實力,使擷取圖像資料準確度高達99.5%,可高效擷取文件中的重要資訊,自動轉換為商業數據,加速及妥善處理業務流程。
智能辨識圖檔化文字