DATALUX(データラックス)とは、独自のAI技術やOCR技術により、イメージテキストの抽出のみならず、非定型文書、非構造化データから、正確にデータを抽出、且つ生産性の高い処理能力を持った、ドキュメント処理の自動化ソリューションです。
マルチモーダルAI基盤のドキュメント処理の自動化ソリューション
※文章の各段落を理解する!精度96.7%(General API基準)


正確なコンテンツ抽出およびデータベース化
DATALUXは、画像処理モデルと自然言語処理モデルを組み合わせたマルチモーダルAI技術を活用し、文章の段落、表、図面などの認識の上、定型化されていない文書でもコンテンツを正確に抽出します。また、抽出元の文書の構造に基づき、抽出後も文脈が保持されます。
コンテンツ単位の検索およびフィルタリング
DATALUXは、抽出されたコンテンツにタイトル、本文の文書構造、コンテンツタイプ、および座標などのメタデータを追加します。これにより、ユーザーはコンテンツ単位での検索とフィルタリングを行い、必要な情報を迅速かつ効率的に検索することができます。
再構築及び利活用が容易
DATALUXは、メタデータを含めて抽出されたコンテンツをHTMLなどの希望する形式に簡単に再構築できるようサポートします。これにより、ユーザーは抽出された情報をさまざまな目的に利活用できます。
サイロ化されているデータの活用を実現
※従来の処理方法対比、処理速度の最大750倍向上(導入前:平均150秒/ページ。導入後:0.2秒/ページ)
全社的な情報活用能力の強化
DATALUXは、組織内データの価値を引き上げ、全社な情報の利活用能力を強化します。これにより、意思決定の速度を向上させ、企業の競争力が確保できます。
蓄積された記録をデータに変換
DATALUXは、マルチモーダルAI技術を使用して、抽出したデータは、データベースに格納します。これにより、データが利活用できる環境が整います。
カスタム情報検索ポータルの構築
DATALUXは、抽出されたコンテンツにメタデータを追加し、 全社内の情報検索ポータルの構築をサポートします。 これにより、必要な情報を迅速かつ効率的に見つけることができます。
社内の知識管理システムの構築
DATALUXは、組織内の知識情報を体系的に管理し、全社内で共有できる知識管理システムの構築をサポートします。また、ファイルではなくコンテンツ単位で、その知識情報の利用履歴を管理することもできます。さらに、コンテンツの類似性や利用履歴に基づいた推奨機能などを適用することで、組織全体の生産性と競争力を向上させることができます。
社内システムや他AIモデルとの連携が容易


社内システムや生成AIなどからの検索先情報として連携
DATALUXは、コンテンツの抽出後、API形式で連携し、LLMベースのチャットボットモデル、AI基盤検索エンジンなどから、様々形で利活用できます。
表形式のデータの場合、JSONタイプでセル構造を格納します。文字情報の抽出、表の構造情報の抽出、画像品質向上、データ属性の拡張など、AI技術を適用する前の前処理作業を行った後、処理の結果としてデータベースに格納されますので、他AIモデルとも簡単に連携できます。生成型QAモデルと組み合わせることで、既存モデルが持つ検索範囲の課題の一部も解消することができます。

処理上のセキュリティ、非定型文書の対応、レイアウト型コンテンツの認識、表形式コンテンツの分類、モデル学習のコスト、推論に必要なメモリ使用量などの側面に対し、他製品と比べお客様より必ずご満足頂けるソリューションを提供しております。

