ワークスタイル変革の実現

butinukiはデータ取得(RPA)、分析技術(AI)を扱うプロ集団として情報の本質を見つめる解析力と
必要なデータを集める力を武器に、お客様のビジネスに貢献します。

業種、規模により異なる生存戦略の上で
「どのようなデータを揃え」 「どう活かし」 「どう繁盛させるか」を
お客様と共に考えることを大切にしています。

注意点

業務を効率化するためのAI・RPAですが、必ずしも成功に結び付くとは限りません。
AI・RPAはそれ自体が目的ではなく、業務を効率化する手段にすぎず
導入して何をしたいか明確であり、正しい仮説を立てなければ
期待する結果につながりません。

私達はセールスマンではありません。
どんな企業がAI・RPAを使ったら楽になるか、売上げを上げられるか、コストカット出来るか
成果にコミットすることに誇りを持つエンジニア、マーケターの集団です。

業務課題を明確にし、その課題をどのように解決するかが重要で
私達はまず問題点と目標を明確に知ることを徹底しています。

自動化、分析を行う前に業務フローとして最適であるか
現場へのヒアリングや業務プロセスの状態を認識することから始め
地に足の着いたAI・RPA技術の提案と実装を行なっています。

プロダクト

AI技術を駆使した
アンチボットソリューション
Concern Image


インフォメーション

Brightdata社(イスラエル)の事例としてご紹介頂きました。

Profile image
Butinuki is a data collection agency that specializes in supporting Japanese companies with public web data collection and analysis using artificial intelligence (AI) and robotic process automation (RPA) technologies. We propose data analysis solutions designed to gather insights that help businesses enhance their creative work styles – inherently fostering more productive work flows, while keeping employees fully engaged within their own responsibilities. Through the process of analyzing and interpreting internal metrics as well as relevant public web data, Butinuki helps identify areas of operations within our client companies that can be enhanced in order to optimize employee performance, and from there we can build systems to enhance future operations. Our solutions are mainly used by clients who have not considered large-scale AI tools but want to partially use RPA and AI technologies. We like to describe our product as basically “a smart AI for your company that can answer everything.”...


固有表現抽出精度の見直し&改善

固有表現抽出精度の見直し&改善

固有表現抽出は自然言語処理のテクニックの一つでテキスト内の特定の名前やエンティティ(固有名詞)を自動的に識別・抽出するタスクです。

※現在、情報抽出の手法としてクローリング、スクレイピングがメジャーです。ただしこれらの手法は構造化されたhtmlに対しては有効な手法ですが、こちらが意図した通りに構造化されていないhtmlの場合、テキスト全体を抜き出し解析を行う必要があります。

固有表現抽出は主に以下のような場面で使われます。

  • 情報抽出: テキストから重要な情報のみを抽出する際に使用されます。ニュース記事から人物の名前、場所、組織名など。テキスト全体からノイズを除外し、固有表現を抽出します
  • 検索エンジン: 検索エンジンは、ユーザーの入力値を元にデータベースから情報を探し、ユーザーの検索意図や関連する情報を返す際に固有表現抽出の手法が有効なケースがあります。
  • 対話システム: チャットボットや仮想アシスタントなどの対話システムでは、ユーザーからの入力から人名、日付、場所などの情報を抽出し、適切な返答を生成するために固有表現抽出が活用されます。
  • 法律文書解析: 法律文書から法的用語、裁判所の名前、判決内容などを抽出して法的文書の分析や要約に利用されます。

固有表現抽出の精度向上とは?

固有表現抽出の精度を向上させるためには、以下のような手法や技術が利用されます。

ディープラーニングを活用した固有表現抽出の手法

ディープラーニングを利用した固有表現抽出の手法では、多層のニューラルネットワークを構築し、大量のラベル付きデータを用いて学習を行います。これにより、より高度な特徴抽出や文脈の理解が可能となり、固有表現の抽出精度が向上します。

Transeformerを使用した固有表現抽出の改善

Transeformerは、自然言語処理のタスクにおいて非常に優れた性能を発揮するモデルです。固有表現抽出においても、Transeformerを利用することで文脈の理解や固有表現の関係性をより正確に捉えることができ、精度の向上が期待できます。

統計的手法と機械学習を組み合わせた固有表現抽出

統計的手法と機械学習を組み合わせた固有表現抽出技術では、統計的なモデルを用いて固有表現の出現確率を推定し、機械学習アルゴリズムを用いて最適な固有表現の抽出を行います。ある特定の条件下ではこの手法で高い精度を出すことが可能となります。

固有表現抽出の精度を向上させるための評価指標

固有表現抽出の精度を評価するためには、以下のような評価指標が利用されます。

エンティティレベルのF値による評価

エンティティレベルのF値は、抽出された固有表現の正確性と再現率を総合的に評価する指標です。高いF値を得るためには、正確な固有表現の抽出と漏れのない再現が必要となります。

エンティティタイプごとの精度・再現率の評価

エンティティタイプごとの精度・再現率の評価では、各固有表現のタイプごとに精度と再現率を計算し、それぞれのタイプにおける抽出の正確性を評価します。これにより、特定のエンティティタイプにおいて精度を向上させるための改善点を特定することができます。

固有表現の境界位置の正確性を評価する指標

固有表現の境界位置の正確性を評価するためには、正解データと抽出結果の境界位置を比較し、その一致度を評価します。境界位置の正確性は、固有表現の抽出精度に直結するため、高い正確性を持つ手法が求められます。

butinukiでは固有表現抽出は自然言語処理タスクを解く重要な鍵ととらえ、今後もさらなる精度向上の方法や技術研究と独自エンジン開発、技術サポートに取り組んでいます。同じようなプロジェクトに取り組んでいる方、またはPOCレベルで検証を行いたい方、お気軽にご相談ください。