「ゴミを食べ、ゴミを吐く」、ベゾスも出資するAI検索エンジンの品質問題

「ゴミを食べ、ゴミを吐く」、ベゾスも出資するai検索エンジンの品質問題

「ゴミを食べ、ゴミを吐く」、ベゾスも出資するAI検索エンジンの品質問題

人工知能(AI)検索エンジンのPerplexity AI(パープレキシティAI)は、自社のサービスがChatGPTのような生成AIツールとは異なると主張している。サンフランシスコを拠点とする同社は、ユーザーが質問を入力すると、独自のAIモデルを用いてインターネット上の最新情報に基づく回答を生成する。また、回答にはその引用元を添える点が特徴だ

パープレキシティのCEOを務めるアラヴィンド・スリニヴァスは、「引用は私たちの信頼の源です」と、4月に行われたフォーブスによる取材の中で語る。

OpenAIの研究者だったスリニヴァスが2022年に設立したパープレキシティは、これまで1億7000万ドル(約270億円)以上を調達しており、ソフトバンクグループは、同社との戦略的提携を発表したのに続いて、ソフトバンク・ビジョン・ファンド2を通じて30億ドル(約4820億円)の評価額で出資を検討中と報じられている。

パープレキシティの投資家には、ジェフ・ベゾスやYouTubeの元CEOであるスーザン・ウォジスキ、OpenAIの共同創設者のアンドレイ・カルパシー、メタのチーフサイエンティストであるヤン・ルカンなどが含まれる。同社の会話型検索エンジンは、急速に支持を集め、エヌビディアのジェンスン・フアンCEOや、デル創業者兼CEOのマイケル・デルなど約1500万人のユーザーを抱えている。

しかし、同社がジャーナリストが書いた記事を盗用したとして非難される中、AIが生成した不正確な内容のブログを「信頼できる情報源」として引用していることをフォーブスは発見した。

AIを使用したコンテンツを検出するGPTZeroが実施した研究によれば、パープレキシティの検索エンジンは旅行やスポーツ、食べ物、技術、政治など、多岐にわたるトピックに関するAIが生成したブログ記事を引用している。この研究は、97%の精度でAIの使用を検出するGPTZeroのソフトウェアを使用して行われた(フォーブスは、99%の精度を持つ別の検出ソフトのDetectGPTを使用してその評価を確認した)。

GPTZeroの研究で、パープレキシティのユーザーは平均3回のプロンプト(命令文)の入力でAIが生成した情報源に遭遇することが判明した。「彼らのサービスの質は、その引用元の質に依存している。情報源がAIのハルシネーションによって生み出されたものであるなら、その出力も同様だ」とGPTZeroのエドワード・ティアンCEOは語る。

「矛盾する情報」を提供

パープレキシティの最高ビジネス責任者(CBO)のドミトリー・シェヴェレンコは、フォーブスへのEメールの声明で、同社のシステムが「完璧なものではない」と述べ、関連性の高い高品質な情報源を特定するプロセスを洗練させることで検索エンジンを継続的に改善していると述べた。パープレキシティは「信頼スコア」を使用して情報源を分類し、スパムが大量に含まれるウェブサイトを排除しているという。

一方、複数のシナリオで、パープレキシティは、AI生成のブログの投稿を引用してヘルスケア関連の情報を提供している。例えば、「細菌への感染を治療するためのペニシリンの代替品」に関する情報を求めた場合に、この検索サービスは、Penn Medicine Becker ENT & Allergyと呼ばれる医療クリニックが運営するAI生成のブログを直接引用した。

このようなデータソースは信頼性に欠け、時には矛盾する情報を含んでいる。同クリニックのAI生成のブログは、ペニシリンアレルギーを持つ人は、セファロスポリンのような抗生物質を代替品として「使用できる」と述べながら、そのまた別の段落では、ペニシリンアレルギーを持つ人は、セファロスポリンを「避けるべきだ」と矛盾する記述をしていた。

ニュース記事の「盗用」

パープレキシティはまた、信頼できる情報源の取り扱いにも問題を抱えている。このスタートアップは最近、フォーブスやCNBC、ブルームバーグなどの複数のニュースサイトの記事からの盗用疑惑で注目を集めている。フォーブスは今月初め、エリック・シュミットの極秘のAIドローンプロジェクトに関する独占スクープ記事の重要な部分が、パープレキシティによって適切な帰属なしに再利用されたことを発見した。

フォーブスは、同社の著作権侵害を非難する停止通告書を送付した。これに対し、パープレキシティCEOのスリニヴァスは、「事実は盗用され得ない」と主張し、同社がフォーブスのコンテンツの再配布や再出版などの不適切な行為をしていないと述べている。

また、ニュースサイトWiredの記事によると、パープレキシティは秘密のIPアドレスを通じてWiredやメディア企業コンデナストが所有する他のサイトにアクセスし、スクレイピングを行っていた。これらのサイトは、パープレキシティのウェブクローラーがコンテンツを盗むのを防ごうとしていたが、それを突破されたという。

スリニヴァスは、Wiredの記事の件について直接反応していないが、「彼らの疑問は、当社のサービスとインターネットの仕組みに関する基本的な誤解を反映している」と述べている。

シェヴェレンコは、パブリッシャーが健全な情報エコシステムを作り出すために果たす重要な役割を認識しており、同社の製品がそれに依存していると語った。パープレキシティは、初の収益共有プログラムを立ち上げて、パブリッシャーに限定的な形で報酬を提供する予定という。同社は、広告レイヤーを追加して、AIが生成した回答に対して同社が収益を得た場合、その回答で引用された情報源のパブリッシャーが収益の一部を受け取れるようにするという。パープレキシティは、The Atlanticなどのパブリッシャーとパートナーシップの可能性について話し合っているとシェヴェレンコは語った。

低品質な情報源への依存

パープレキシティは、RAG (Retrieval-Augmented Generation)と呼ばれるプロセスを通じて、AIシステムが外部のデータソースからのリアルタイム情報を取得し、チャットボットの回答を改善する。しかし、これらのソースの品質が低下すると、AIの回答の質も低下する可能性があると専門家は指摘している。

ケンブリッジ大学で機械学習について研究するザック・シュマイロフは、情報源自体がバイアスや不正確さを含んでいる場合、そのデータを基に構築されたアプリケーションは最終的に「モデル崩壊」という現象を起こす可能性があると説明した。AIが生成したデータで訓練されたAIモデルは「ナンセンスを吐き出し始める」と彼は述べている。

また、低品質なウェブ情報源への依存は、他の多くのAI企業にとっても広範な課題となっている。グーグル検索のAIを用いた要約機能は5月に、ピザにチーズを貼り付けるために接着剤を追加することを提案したり、「石を食べることが健康に良い」と主張したりしたが、これは、掲示板Reddit(レディット)のフォーラムやThe Onion(ジ・オニオン)のような風刺サイトの情報源を引用したためだと見られている。

グーグル検索の責任者であるリズ・リードは、特定のトピックに関する質の高い情報が不足しているために、一部の誤った結果が表示されたとブログで認めていた。

「パープレキシティの問題はその一例に過ぎない。それは病気の症状であり、全体の問題ではない」とGPTZeroのティアンは述べている。

(forbes.com 原文)

OTHER NEWS

42 minutes ago

北朝鮮の金正恩は「ロシア・プーチンを裏切るだろう」…! 脱北者たちが口をそろえて「断言」した”意外な近未来図”

42 minutes ago

またザバラがやってしまった…日本ハム・レイエスの満塁弾を2度目の帳消し 5割に逆戻り

42 minutes ago

巨人・浅野翔吾に「一軍英才教育」待望論 求められる“高卒2年目レギュラー定着”の王道

42 minutes ago

五輪不参加なのになぜ? 遠藤航がリバプールの開幕予想スタメンから外れる!地元メディアがアンカーに予想したのは...

42 minutes ago

BE:FIRST X ATEEZコラボ曲「Hush-Hush」MV公開 総勢15人で圧巻パフォーマンス

42 minutes ago

東方神起×中島健人、夢のコラボステージが実現!「FNS歌謡祭」で“息ぴったり”のパフォーマンスを披露

42 minutes ago

レッドソックス吉田正尚が5打数3安打1打点で勝利に貢献 WBC思い出の球場で爆発

42 minutes ago

「琵琶湖に道ができている」と通報 湖岸に無許可の通路 県が告発

42 minutes ago

延伸へ3車両購入 ひたちなか海浜鉄道 JR東から 茨城

42 minutes ago

7月開始ドラマ“絶対面白い"5選。『silent』タッグの“月曜”も期待だけど、間違いなしの大本命は

42 minutes ago

高級「佐藤錦」シワシワに…生産者の悔し涙 シャインマスカットは日焼け、実割れ

42 minutes ago

猫を乗せて走る『ダンボールカー』作ってみたら…まさかの光景が可愛すぎると189万再生の大反響「クオリティーの高さに脱帽」「素敵」

42 minutes ago

「フェードは体の近く、ドローは遠く」が決め手! キャディバッグを使った簡単練習法

42 minutes ago

「METAL ROBOT魂 (Ka signature) <SIDE MS> Sガンダム ブースター・ユニット装着型」レビューロマン武装を備えたSガンダムが濃密ディテールで再び登場

42 minutes ago

アウディQ6 e-tronクワトロ(4WD)/SQ6 e-tron(4WD)【海外試乗記】

42 minutes ago

寺門ジモン:Snow Man渡辺翔太&中村アンとヤー! 「青島くんはいじわる」出演 「なるべくウザさを消して頑張ろうと」

42 minutes ago

北海道の女子高校生殺害、転機は橋から100キロ両岸を徒歩で調べた大規模捜索…捜査幹部「ご遺体を発見できるかがカギだった」

42 minutes ago

「身体が走り続けたいと言っている」 2008年モデルのグラントゥーリズモは驚くべきGTカーだった!

42 minutes ago

日向坂46富田鈴花、愛車の国産車を初洗車 まるで新車な輝きに感動「めっちゃきれい」

42 minutes ago

ラピッドトリガー対応の75%ゲーミングキーボード「VK720A」が発売、配列や本体色の違いで4種類

42 minutes ago

独立リーグから韓国プロ移籍の投手、契約終了で退団 国内人気で他球団移籍の可能性も【地元メディア報道】

42 minutes ago

【巨人】優良助っ人・ヘルナンデス 一軍昇格時の「懐疑的な声」を跳ね返した〝修正力〟

42 minutes ago

【ソフトバンク】広瀬隆太が難敵・武内攻略へ意欲「1発バシっと」大学日本代表ではチームメート

42 minutes ago

大型犬が『大好きな赤ちゃん』に遊んでほしくてとった行動…可愛いが大渋滞している光景が29万再生「本当に心優しい犬」「みんな天使」と絶賛

42 minutes ago

50代、思いきって手放した「大型家具」3つ。処分を決めた理由と代用しているもの

42 minutes ago

INI、自身初のデジタルシングル1位 自己最高の週間&累積DL数を記録【オリコンランキング】

42 minutes ago

円安はいつまで続くのか、アメリカの金利が下がるきっかけをFRB高官の発言から探る

42 minutes ago

最新「スピード取り締まり」がヤバい! パトカー見える前に“一網打尽”!? 恐怖の「おいでおいで作戦」&「いないいない作戦」の正体とは!

45 minutes ago

トヨタから新型「ミニランクル」登場か!? 名前は「ランドクルーザーFJ」か? 250系に続く新モデルはレトロデザイン? いつ発売?

45 minutes ago

巨人・阿部監督 井上快投に大喜び「どこ行っても地元だと思って投げてもらいたいね。以上」

45 minutes ago

広島 天敵の阪神・大竹にまたやられた…新井監督「全ては私の足りなさだと思います」

45 minutes ago

日本株は続伸の見込み、米経済指標下振れで利下げ期待-電機に買い

45 minutes ago

西条35.5度 愛媛で初の猛暑日 熱中症疑いで12人搬送 小学校では暑さしのぐ”ミスト”も【愛媛】

45 minutes ago

澄田綾乃、はだけた和服から白ブラあらわ 妖艶ショットに「こんな美人が家に居たらいいな」

45 minutes ago

静岡大の前学長が古巣を痛烈非難「植民地を手放そうとしない帝国主義国によく似ている」 浜松医大との統合再編めぐり

45 minutes ago

半導体商社の萩原エレクトロニクス 新連携サービスを展開 企業や大学の可能性探る

45 minutes ago

俳優の池田匡志さん(徳島県出身)が映画「闇金ドッグスX」に出演 8月10日からCSチャンネルで放送

45 minutes ago

東京都知事選の最新調査結果!支持政党別、情報源別に徹底解説!選挙ドットコムちゃんねるまとめ

45 minutes ago

【ユニクロ or GU】今年一番使える「最優秀Tシャツ」はどれ?

58 minutes ago

セブパシフィック航空、エアバスA321neoを最大152機導入