生成AI(Claude 3)×ETLならReckoner(レコナー)
生成AI(Claude 3)を活用し様々なデータ表記(ひらがな・カタカナ・漢字・表記揺れ)を一括でローマ字表記に統一する方法
現状・問題点
営業チームが案件情報をGoogleスプレッドシートに入力しているが、表記方法のルールが徹底されていない。そのため、同じ意味の言葉が漢字、カタカナ、ひらがなで混在し、データの視認性が悪く、分析作業にも支障が出ている。統一ルールを設けても、なかなか浸透しないのが現状。様々な表記があっても、一括でクレンジングし、データを使える状態にしたい。
Reckoner(レコナー)導入の効果
データクレンジングの自動化による分析作業の効率化
ETL(Reckoner)内で生成AI(Claude 3)を活用することで、漢字、カタカナ、ひらがなの混在など、表記ゆれのあるデータも自動で認識し、統一することができる。これにより、これまで手作業で行っていたデータクレンジング作業を自動化でき、分析作業にかかる時間と労力を大幅に削減可能。また、データの精度向上にも繋がり、より精度の高い分析結果を得ることができる。
営業担当者による入力負荷の軽減
Reckonerで自動で一括データクレンジングが行えるため、営業担当者は表記方法を意識することなく、スムーズにデータを入力できる。営業担当者は本来の営業活動に集中できる時間が増え、生産性向上が見込める。
生成AI(Claude 3)を活用し様々なデータ表記(ひらがな・カタカナ・漢字・表記揺れ)を一括でローマ字表記に統一する方法
STEP1
接続設定
・Reckoner(レコナー)が、異なるデータ表記(ひらがな・カタカナ・漢字・表記揺れ)が混在しているGoogleスプレッドシートにアクセスできるようにするため、OAuthもしくはp12キーで認証をおこなう。
・Googleスプレッドシートからデータを取得する。
STEP2
データ加工・変換
・「フィールド変換」タスクを用いて生成AI(Claude 3)に与えるプロンプトを入力する。
・「列結合」タスクを用いて、生成AI(Claude 3)に与えるプロンプトと表記揺れがあるデータを同じフィールドに統合する。
・「HTTP」タスクを用いて、生成AI(Claude 3)にプロンプトを与える
・「CSV展開」タスクを用いて、カンマ区切りされた元の値と表記統一・表記揺れ解消後の各データをそれぞれ別のフィールドに出力する。
STEP3
ワークフロー作成・データ連携
検証環境を用意することなく、Reckoner(レコナー)の画面上で処理結果のプレビューをぱっと確認。バッチ制作不要で、Googleスプレッドシートと各タスクを繋いでデータの流れを作成する。
Reckonerでの解決ポイント
ETL内で生成AI(Claude 3)を活用!
ETLで生成AI(Claude 3)を活用すれば、自然言語で簡単に複雑なデータ加工処理が可能。