( 257488 ) 2025/01/30 07:05:25 2 00 中国ディープシーク、米オープンAIからデータを不正入手か…米報道読売新聞オンライン 1/29(水) 12:55 配信 https://news.yahoo.co.jp/articles/6c43c925bf43a1e690bc2891e8d32308da7ca2e6 |
( 257491 ) 2025/01/30 07:05:25 0 00 ディープシークのアプリのアイコン=ロイター
中国の新興AI(人工知能)開発企業「ディープシーク」を巡り、米ブルームバーグ通信は28日、ディープシークの関係者が対話型AIサービス「チャットGPT」を開発した米オープンAIからデータを不正に入手した可能性があると報じた。オープンAIと、提携する米マイクロソフトが調査に着手したとしている。
報道によれば、ディープシークの関係者とみられる人物が昨年秋、オープンAIから大量のデータを盗み出した可能性があるという。マイクロソフトのセキュリティー担当の研究者がこの事態に気付き、オープンAIに通知したとしている。
トランプ政権でAI分野の政策責任者を務める著名投資家のデービッド・サックス氏は28日、FOXニュースとのインタビューで、ディープシークがオープンAIから技術やデータを盗み、自社のAIモデルの開発に悪用した可能性を示唆した。今後数か月かけ、同様の事態が起こらないよう対策を進める考えも示した。(ニューヨーク支局 小林泰裕)
|
( 257490 ) 2025/01/30 07:05:25 1 00 この記事では、中国のAI企業がアメリカの最先端技術を不正に入手した可能性について議論されています。
技術開発や国際競争での情報戦の激化、AIの利用やデータの取り扱いに関する倫理やセキュリティの問題、さらには国内外の経済や政治的な動向にも言及があります。
(まとめ) | ( 257492 ) 2025/01/30 07:05:25 0 00 =+=+=+=+=
この報道が事実なら、中国のAI企業が米国の最先端技術を不正入手した可能性があるという、技術覇権争いの縮図ともいえる問題だ。オープンAIのデータが盗まれたとすれば、それがモデルの重みなのか、学習データなのか、アルゴリズムの詳細なのかで影響が大きく変わる。特にモデルの重みが流出していれば、ディープシークは独自の訓練プロセスを省略し、一気に競争力を高める可能性がある。一方、米国の技術流出に対する警戒感はこれまで以上に強まり、今後さらに厳しい対中規制が敷かれるかもしれない。問題は、こうしたスパイ行為が明るみに出たとしても、中国側が技術を十分に活用できれば、結果的にAI競争が加速することだ。技術開発は国際競争の最前線であり、情報戦の様相を強めつつある。
▲3503 ▼385
=+=+=+=+=
ディープシークは、深層学習に基づく情報検索技術であり、大量のデータから関連性の高い情報を効率的に抽出することが可能です。この技術は、自然言語処理や機械学習の進歩によって実現され、検索エンジンや推奨システムなど、さまざまな領域で活用されています。ディープシークの特徴は、従来のキーワードマッチングにとどまらず、文脈や意味を理解する能力にあります。これにより、ユーザーの意図に沿った情報を提供し、検索結果の精度を向上させています。特に、複雑なクエリや専門的な情報を必要とする場面で、その効果を発揮します。一方で、データプライバシーやアルゴリズムの透明性といった課題も存在します。特に、大量の個人データを扱う場合、適切な規制と倫理基準の維持が求められます。今後の技術発展においては、これらの問題に如何に対応するかが重要なテーマとなるでしょう。 スイートポテト職人です。ディープシークこわいわ
▲156 ▼403
=+=+=+=+=
当然我が国も多様な方面の情報は抜き盗られているだろうが対中に関してはダンマリですね。マイナ・カードはその最たる物ではないですか。導入に当たってはカードを取得した人のは物凄い恩典というかポイントを付与してましたよね。国税を使って吸い上げた個人情報がジャジャ漏れのセキュリティでは「どうぞ」と言わんばかりです。これから2月に入ると確定申告が始まります。大勢の人が押し寄せ一日仕事、これでパンディミックなど起こったらどうしますか?公認の感染場所になりえます。当初マイナ・カードで確定申告が出来ると唄ってました。もう何年になりますか?いまだ日の目を見ないシステムなど必要ですか?言い出しっぺの立件民主党の野田党首、今度は保険証を紙ベースに戻せだって!自分が東北大震災の尻ぬぐいが出来ず、故安倍さんに此の導入と引き換えに政権を譲ったんでしょ。ハッキリと失敗だから止めましょうと言うのが責務でしょ!
▲53 ▼179
=+=+=+=+=
米中のAI戦争なのだから、こういった報道を「事実なら」とか論評する必要はない気もする。日本としても、無理だ無理だと騒がず、独自のAI開発にしっかりチャレンジする必要があると思う。
▲1955 ▼181
=+=+=+=+=
確か台湾の半導体技術を米中で奪い合っている時、バイデン政権がアメリカから大量に研究者、技術者が中国へ流れ込んでると指摘していた。「今すぐ帰国するかアメリカ国籍を捨てるか選べ」とも彼らに警告していた。
その頃アメリカはファーウェイを締め出していたが、アメリカ国内から色々と流出してた可能性はあるのだろうか。
▲1180 ▼63
=+=+=+=+=
そりゃ性能&コスパ良くなるよなw他がいろいろ苦労して学習してたのをマルっとかっさらって結果だけ学習させれば1/10にもなるわ。 かの国じゃデザインとか意匠とか、他のところがそれなりにコスト掛けて試行錯誤しているのを寸法と座標取って数値化したものをNCなりに掛けるだけなんだから、安くできるのは当たり前。 ちな自分が元勤めていた会社の機械も同じことされて、寸分違わぬコピー作られて、客から故障したときに「部品ある?」って問い合わせきて台帳調べてもシリアル出てこないんで、調査したらコピーされてた(しかも値段半額)ってのあったからな。
中国、そういうとこやぞ?トランプとかに目を付けられるの。天安門。
▲1280 ▼134
=+=+=+=+=
DeepSeekの構造上の課題は、全パラメータ数が非常に多いが、実際に起動しているパラメータは桁違いに少なく省力化のメリットがある疎状パラメータなのだが、その大元の巨大なパラメータを作り上げるためには、比例して桁上げて巨大なトレーニングデータセットが必要になること。この部分の確保のために、ChatGPT4Oを使ってデータ作成つまり4Oからの出力を使って、トレーニングをしていたという疑い。多くのユーザーが同一の結果が出ることが多いと報告があり、かなりの確率で相当に疑わしい。
言い換えれば、省力版の小さな有効な高効率起動パラメータのために、大元のパラメータはそのために比例して巨大なデータがないとダメだという構造的問題。濃縮過程のような感覚でもおおよそあっている。
中国企業であるから驚きはない。IPの勝手入手は伝統であり、日本企業も多くは利用されてきた。目先の利益で重要技術を渡すなど。
▲639 ▼64
=+=+=+=+=
ディープシークは極めて短い開発期間でリリースにこぎつけているので、記事にあるようなデータの不正入手がなされた可能性は十分にあるだろう。一方で、アメリカと中国の開発競争の中ではアメリカ側のインターフェアもありうるので、実際にどのような論拠が示されるのかも気になるところだ。いずれにしても、ハイエンドGPUと電力のパワーで突き進んでいくという生成AIビジネスにディープシークが一石を投じたことは間違いなく、ハイエンド至上主義から外れてそこそこの性能で低廉なモデルを求めていく動きが相応に進むと思われる。半導体そのものからアプリケーションやセキュリティといった周辺業界への投資資金のシフトも進むのではないか。
▲693 ▼105
=+=+=+=+=
Nvidia の株価暴落は、オープンAIの製品が最新鋭半導体の使用を前提に、最高性能を目指しているのだが、ディープシークはコモディティ化した旧式半導体でそこそこの性能を出すような設計が原因で、Nvidiaが期待する利益が得られないだろうということ。 しかし、企業向けなどの大規模AIについては、オープンAIの優位性は確保されているのではと思う。あとは、ロジック的に中国製はあくまでも政治的な制約を受けているという大きな弱点がある。
▲819 ▼142
=+=+=+=+=
生成AIが他人の権利物や知的財産を勝手に利用して発展する様を見ていて、いずれ必ずこうなると思っていたんだよなぁ。早い話、生成AIは他者の権利を従来の枠組みでは対処できない方法でロンダリングや不可視化して、自らの価値に転換してきた。その相手がAI企業同士になったというだけの話。 今回は技術が盗まれたという内容の記事だけど、技術が盗まれたということは生成AI内部のブラックボックス性からして、証明することはできなさそう。 また、生成AIの制作にには優れたAIの解答を新たなAIのインプットに利用する蒸留というものがあって、それを規制することはまずできない。openAIは大資金を投じてAI開発をするが、そのAIを教師として超安価にAIの製造ができちゃうんだよね。 生成AIが台頭してから、何事も他者の成果を後からかすめ取るのが大正解になってしまって、すっかり先陣を切るメリットが薄れてしまったな。
▲284 ▼42
=+=+=+=+=
NVDAの株価は一昨日17%マイナス、昨日は8%プラスに転じた。 NVDAのGPU技術水準は世界でトップの地位を独走しており、それは当面ゆるぎない。
DeepSeekのような廉価型・省エネ型のAIが多く台頭すればするほど、利用者が増え、リクエストが増大する。 同時多発的に高速処理を行うGPU、できるだけ新しい世代で高性能・省エネルギーな製品が求められることに変わりはない。
さらにその処理を一括して行うために電力や冷却などインフラを高度に効率化した巨大なデータセンター、エネルギー産地近傍でのロスの少ない発電設備の増強は必須。 これらに関連する米国の原子力発電やガスなどのエネルギー銘柄、電力会社の株価も反騰した。
DeepSeekが不正を…というニュースは大勢に影響しない。 どのAIテクノロジーも、他社の公開情報、インプットとアウトプットの関連は競うように情報収集している。
▲19 ▼6
=+=+=+=+=
誰かいってるでしょうが 「Deep Thief」だったということですね 他所のAIの解答をデータベースにし解答元にして計算 一次データからの解答より選抜されているから早く低性能でも正答率が高まると 今後対策されて他のAIから遮断されればアップデートも遅れるのでは?DeepSeek単体ではできない、性能が低いからそうしているはずですし 省力化の仕組み自体は評価すべきですが
▲31 ▼7
=+=+=+=+=
「製品」とは「プログラム」であって、「情報」を集める行為は「製品の開発」を行う事には当たらない、と言う事も出来そうに思う。
生徒が先生に、たくさん質問させて答えをプールするみたいな方法であれば、確かに安く製品が出来そうに思う。 ただし、結果は似たようなものでも、分析能力や根拠の確定はプロセスの深さが重要。 安価なものは「大間違い」や「簡略化」をするかもしれない。
▲2 ▼9
=+=+=+=+=
deepseekに関しては、産みの苦しみのための莫大な投資を嘲笑的に評価しいる人がヤフコメにも沢山いましたけど、こういうことなんですよ中国ってのは。 人手による学習部分を自動化したのは偉いと思いますが、AGIを目指すなら依然として莫大な計算リソースが必要。いつの時代もハードは優秀であれば優秀なほど良い。これからもそれは変わらない。
ま、o1レベルを安価に使いたくてセキュリティも気にしない人ならdeepseekを使えばいいと思いますよ。 ただし、ポリシーはよく見ることをオススメします。私はポリシーを見て利用は止めました。
▲46 ▼18
=+=+=+=+=
「ディープシークがオープンAIから技術やデータを盗み、自社のAIモデルの開発に悪用した可能性を示唆した。」
技術を盗んだのかデータを盗んだのか、両方なのか分からないが、見出しでも強調されている「データを盗んだ」という方は、出力を比較したということだろうか。 ライバル企業の製品を購入して比較するのはどんな業種でも行われているので、そういうことなのか、何らかの技術を盗んでいると疑っているのか、その点ははっきりさせた方が良いように思う。
▲5 ▼0
=+=+=+=+=
この報道が事実かどうか分からないけど、ちょっと興味深いです。まったく根拠は無いけど、今までより少ないリソースで運用できるAIと聞いて、何か理由がありそうだな、と感じていました。
それにしても、株式市場を始めこれだけ騒がせたのは、人類の弱さと言うか、何かが露呈したように感じました。
▲166 ▼33
=+=+=+=+=
ChatGPTについてはモデルを手に入れたとて同じ結果にはならないので、 手に入れたものはもっと基幹的な重みにかかわるところではないかと。 言語系のAIは本当にたったひとつのパラメータで出力の質が恐ろしいほど変わるというし、 (例えば英語だと冠詞の重みが変わるだけでまったく意味をなさなくなるという話がある) ここは相当怖いところではある。
▲0 ▼0
=+=+=+=+=
このニュースをChatGPTに聞くと以下のように詳しく教えてくれる。ディープシークに聞くと「そんな事実はない」と答えるのが面白い。
Microsoftのセキュリティー研究者は昨年秋、ディープシークと関連があるとみられる複数の人物がOpenAIのアプリケーション・プログラミング・インターフェース(API)を使用して大量のデータを流出させているのを確認しました。OpenAIのAPIを大量に使用してChatGPTの出力データを取得し、そのデータを用いて「蒸留」された軽量モデル(R1)を作成した可能性が指摘されています。 米政府のAI責任者であるデービッド・サックス氏は、ディープシークがOpenAIのモデルのアウトプットを参考に技術を開発した「相当な証拠」があると述べています。 しかし、現時点では調査が進行中であり、ディープシークによるデータの不正入手について確定したわけではありません。
▲61 ▼19
=+=+=+=+=
ディープシークは使用しない方がいいですね。 天安門事件とは何か?と質問してみたところ、英語ではなくなぜか突然、中国語で返答してきまして「それについては答えられません」と回答。 お話になりません。 サービス規約も問題があり、シリコンバレーのITエンジニア曽根原春樹氏がこのディープシークの規約を精査した報告によりますと、1.法的準拠法:ディープシークの利用に関する紛争は中国の法律に準拠する。 よって日本国内の法律や裁判は適用されません。 2.知的財産権:ユーザーが出力したあらゆるもの(収益も含め)は全てDeepSeekのものである。 3.ユーザー情報及び利用履歴:中国国内のサーバーに保管する。 これらは中国の法律に基づいて取り扱われる。 つまり日本の個人情報保護法は適用されません。 4.ユーザー責任:ユーザーが行う入力内容や生成された出力に対し責任を負うものとする。 「天安門事件とは何か?」
▲4 ▼3
=+=+=+=+=
高性能GPUの優位性は変わらないだろう。もしもDEEPSEEKのアルゴリズムが優れていたとすれば、高性能なGPUを使えば、より高精度な結果を生み出せるようになるからだ。 これまでの歴史からも、半導体の性能が下がるということはなく、より高度化するために性能が必要になっている。 また、AIを進化させるためには大量のデータ学習が必要なことも変わりなく、やはり半導体の性能は不可欠である。(この部分のデータを盗まれたのなら、一気に進化できたことは頷ける。) エヌビディアが落ちるのは、汎用性の高いGPUをAIに活用するのではなく、AI に最適化された半導体がGPUの性能を安価に超越したときだろう。
▲199 ▼132
=+=+=+=+=
AIの学習方法として「蒸留」と呼ばれる手段があります。
創始であるOpenAI社では、開発中のAIが正しく学習しているかの確認を人の判断も含めた様々な手法で行っています。 しかし、あらゆる入力に対して正しい結果を返すツールが既にあったとしたら、そのツールとの応答を自動で繰り返すだけで高速に学習を進めることができます。
当然ですが、AIを公開している各社はこの方法での学習を禁止しています。
▲10 ▼2
=+=+=+=+=
もちろん、技術漏洩があったとしたらそれは問題だろう。 だが、シリコンバレーや、あるいは市場関係者が危惧しているのは、 ディープシークのデータセンターの建設にかかったコストが、数十億円以下 ではないかということ。なぜなら、著名投資家とはいえ、外部の支援を 受けずに自費で建設しているため。
いま、特にトランプが当選以降、ソフトバンク然り、 100兆円かけてデータセンターを建設とか、そういうことを計画している。 これらの計画がすべてバブルで、実はすごい安くできるんじゃないの? というような、完全な目算のズレが可能性として 指摘されており、それがエヌビディアの株価暴落を招いている。
巨大データセンターの計画は、原子力発電所を増やすことまで 計算に入れており、かなり広範囲にコストの再計算が必要となる。 つまり、エヌビディアだけの問題ではないっぽい。
▲106 ▼20
=+=+=+=+=
その方法が実際に容易にできて、性能はがっつり金と手間暇かけて作ったシステムとさほど劣らず、それでいて安上がりにできたと言うのが事実になれば、AI戦争は終結じゃない?
だって、穴があり、そこに入り学習して同じようなものができるんやで。ぶっこみガチ勢はもうやる意味ないやん。投資回収不可能やん。今までの労力と資本が無駄やん。
オープンAIはそんなに入りやすいわけないと思うけど、それが出来たというのも技術力。
▲29 ▼51
=+=+=+=+=
オープンAIの重要なデータも少し前までネットから普通に吸い出せると ニュースになっていましたよね。
そのニュースの発端は、ディープシーク社だったのかもしれませんね。
データ自身を流用というよりも思考を導き出すまでにどの程度の段階を 経て結果を得ているかなどの構造を把握したことで、さらに効率的な システムが出来上がったのかもしれない。
もし、そうであれば、実データを搾取していないので、犯罪としては 立件できないのではないか。
▲63 ▼45
=+=+=+=+=
データや学習プロセスのような情報資産は、いくら隠蔽しても長い年月のうちには必ず漏洩するものです。
半導体の障壁はあるものの、他の業種に比べて物理的な参入障壁が少ない分、漏洩したデータが世界に広まれば、AIはコモディティ化してそれほど価値の無いものになってしまうでしょう。
ディープシークがOpenAIを超えたとは全く思いませんが、技術の陳腐化や漏洩によって一晩で勢力図が塗り替えられてしまう可能性があることを、今回の事案は表していると思います。
思い返せば、ChatGPTがリリースされたときも今回と同じような衝撃がありましたね。歴史は繰り返すと思います。
▲118 ▼112
=+=+=+=+=
中国のことだから 不正入手と容易に想像出来ますが 厳密にセキュリティー管理と 不正入手なら責任の追求を期待したい。 日本でも法整備と実行を確実に行ってもらいたい。
▲8 ▼3
=+=+=+=+=
昨日この会社「シリコンバレーでも注目を集める中国製AI「DeepSeek」、そのすごさと創業者」で持ち上げ記事書かれてたけどな。 これが本当なら結局所詮模倣や他国の技術を使って成り上がっただけで自分の国では何もしてないっていう話になってしまうんだろう。 TikTokも開発はフランスの会社だったしな。ただこっちは合法でその技術とサービスを買った訳だから、商売としての先読みする力や能力はあったと未だ評価出来る。
▲12 ▼13
=+=+=+=+=
もうオープンソースとして公開してしまった以上、言語化生成AIの独占は不可能になった。 このソースを活用して雨後の筍みたいに新興企業が色々なものを作ってくるだろう。 AI分野で独占しようとしてた米IT大手の目論見は外れたことになる。 高性能半導体とAIだけがアメリカのアドバンテージだったのに DeepSeekはその2つとも一気に無価値にしてしまった
▲86 ▼43
=+=+=+=+=
アメリカにも日本にも多くの中国人留学生いる。彼等の中に技術習得して中国で起業する人間も多いだろう。そんな技術が中国の軍事産業に活かされていても不思議ではない。アメリカではトランプが中国人留学生の大幅な制限考えている。翻って日本は何もしていないどころか中国人のビザ緩和等している。本当に日本は甘い。大幅に見直す必要ある
▲14 ▼7
=+=+=+=+=
ダメージを受けた側が「あっちの安さは不正な安さだ」とジャブを返してくるのは、出るべくして出てる感じ。 その根拠を色々示してくるまでは話半分とした受け止めでいい。 今回のdeepseekは「オープンソースの(現状最高性能ではない)欧米AIを、論文発表したような従来よりもシンプルな負荷の低い学習方法で追加学習させただけでも最新鋭に負けないくらいめっちゃ賢くなった」とい話であり、 学習のための設問とその正答という膨大なデータをどこから調達したのかという疑問は残っている。 なので「規約を破って現行最高性能のAIの受け答えを学習させた部分があるだろ絶対」みたいな反応なんだと思う。
▲3 ▼0
=+=+=+=+=
DeepSeekに尖閣諸島の事を聞くと中国の領土という主張をしてくるようです。 AIにたくさんたくさん学習させて自分達の良いように教育しているんでしょうね。
ちなみにChatGPTでは日本の領土としつつも中国と台湾が領土を主張していると出てきますし、1969年に国連の調査で周辺海域に石油や天然ガスがあると発見されてからあちらさんの主張が始まったと書いてあります。 もうね、如何にもという。。 ChatGPTはこの話題で台湾を台湾(中華民国)としているのも凄い。
▲61 ▼13
=+=+=+=+=
そもそもOpenAIだってNovelAIだって、PixivやTwitterから違法に無断転載された日本人クリエイターのイラストを学習させてるんだから、倫理的には人の事言えた物じゃないだろう。
生成AI自体が、実際には「人から盗んだデータを使う物に過ぎない」という化けの皮が剥がれ始めている。AIバブルの崩壊は近い。
▲12 ▼1
=+=+=+=+=
オープンソースプロジェクトでそんな事するかな? するなら徹底的に加工する気がするけど。 別に中国の肩を持つ気は無いがいかにもアメリカの政府筋っぽいやり方だなとは思う。 というか盗まれたことは認めるならchatGPTのセキュリティ信頼性のほうが問題では? まだまだ本格利用は先だなぁ
▲10 ▼1
=+=+=+=+=
ディープシークの高性能がオープンAIのデータを前提としたものだとすると、低コストというのは怪しくなります。本当のディープシークの開発コストは、多大なコストをかけて作ったオープンAIデータのコストを上乗せして計算しなくてはなりません。ディープシークで使用GPUが少なくなるという説も怪しくなってきました。
▲8 ▼4
=+=+=+=+=
強化学習モデルを組み合わせたことに発想のアイデアは評価するが、報道にあるように元になるデータを不正入手したということが事実であれば、OpenAIやMSから訴訟対象になり、MITライセンスとは言え、公開はされなくなるだろう。
▲9 ▼9
=+=+=+=+=
この記事、マイクロソフトが調査スタートしたとも書いていないし、ディープシークの関係者とみられる人が不正に大量にデーターを入手した可能性があるとか、具体性のない、かなりあやふやな弱い記事ではありませんか。著名投資家のデービッド・サックス氏の発言だとか。投資家と言うAI相場のポジションを持った人の発言なので注意が必要ではないでしょうか。
▲10 ▼0
=+=+=+=+=
AIデータは膨大なコスト(高性能ハードと電力)をかけて作られるもの。ぽっと出の新興勢力が簡単に用意できるものではありません。
また、これから時間をかけて一から作っていくとしても、中国政府のために悪用される恐れの高いものに協力する行為は正気ではない。
▲39 ▼23
=+=+=+=+=
ディープシークは『六四天安門事件』を調べる事が出来なかったり魚釣島について間違った情報を押し付けて来たりとても公平性のあるAIとは言えず、裏側に居る中国共産党の為の煽動情報拡散ツールでしかありません。 こんなものを機能に組み込まれては世界中に誤認情報がばらまかれる事になるでしょう、思想や主義を排した公平性のあるツール開発を求めます。
▲0 ▼4
=+=+=+=+=
有能なエンジニアは国も会社も渡り歩いているので人に付随した技術他の移転はあると思います。 米企業の技術も中華系の人がキーの場合が大変多い。米から中もあれば、その逆もしかり。 米のほうが勝つためには何でもやることは、先日の製鉄で学んだはず。
▲10 ▼3
=+=+=+=+=
彼の国は、自動車に関しては精密加工の技術が必要なのエンジンカーを作ることが出来ないので、エンジンカーに比べて技術難易度が低いEVに注力するも、もはやハイブリッドカーに勝てない(環境負荷)状況になり、AIもこの報道が正しければ「盗用」ということで、何ら技術基盤がない、ということになる。
結局はこういうことだろう。
▲6 ▼10
=+=+=+=+=
中国だからやってるのかもしれないし、もはや完全にライバルという立場になったアメリカの嫉妬の言いがかりかもしれない 悲しいのはもはや日本はこういう高度技術でマジで完全に蚊帳の外という状況 技術ではもうダメ、かと言って文化面では韓国に背中も見えないほど追い抜かれちゃったし、日本の存在感がどんどんゼロに近づいている
▲10 ▼2
=+=+=+=+=
重要なのはchatGPTは開発途上であるということで、その開発中のデータを流用したアプリを作ったところで、chatGPTがアップデートした途端に陳腐化するということ。 中華企業は他社や他国のアイディアや技術の盗用を全く悪びれずにやるところがあるので、今回のアプリも同じなのかなと。
▲7 ▼10
=+=+=+=+=
中国は業種問わず全ての物をコピーするのは半端ない。 私どもはファッション業界のメーカーですが以前中国にサンプルとして持ち込んだイタリーのある素材2時間で完璧なコピー作って驚いた事があります。 ITなんか問題なく完コピするスキルは十分ありますね。
▲8 ▼6
=+=+=+=+=
こういう記事が出れば「中国企業なら やりかねないよね」とは思います。ただ、アメリカ企業も今までクリーンな競争をしてきたわけではないので「テキトーなことを言って、競合にイメージ的な損害を与えているだけでは?」とも勘ぐりたくなる。特に中国IT企業には何をしても何を言っても良い…みたいな風潮がアメリカITやマスコミにはあるような気がする。
▲11 ▼0
=+=+=+=+=
はっきり言います。 この最、中国産のAIと食料なら食べ物のほうがまだマシかもしれません。 そういうレベルで、中国産のネットにつながる「アプリ」「スマホ等の電子機器」には最新の注意というよりも使用してはいけません。
なぜならば、使えば高確率であなたの全ての情報(写真・動画・音声・メール等の個人情報)が抜かれてしまうからです。
それはあなただけの問題に限らず、あなたのスマホや電子機器に入っている他人の情報もまた対象なのです。
よく考えて、花咲く畑から抜け出してセキュリティ意識を高めましょう。
▲4 ▼3
=+=+=+=+=
AI技術を保護するための法律なんてありませんし、技術自体はオープンソースなので批判される理由もありません。 そもそも元データも権利者にはお金を払わずに、無断でアーカイブしたサイトに払っただけなのでやってることは同じです。
▲0 ▼0
=+=+=+=+=
恐らく、米国はまた国家安全の脅威の名義で、DeepSeekを規制するはずです。サイバー攻撃や汚名化の認知作戦の手段を含め、絶対に中国に潰し、負けたくない気持ちでしょう。恐らく日本も同じです。みんな中国の技術の進化に不安を持っている。
ただし、長い歴史上に見ると、かつて中国の数千年の世界のNo1になっていたので、ただ近代の清の100年だけ、国家封鎖で科学技術面が欧米より落ちました。近年、中国が科学技術で取った進歩を誰でも認められる。そのため、将来に中国がまた世界のNo1に戻しても、決して異常ではない。
▲4 ▼2
=+=+=+=+=
セキュリティ意識の高いはずの米国でもこの様な被害(現段階では可能性だが)が出ており、スパイ活動に対する法整備が遅れている日本では、最新の技術開発競争へ参入にリスクが予想される。
リスクがあると言う事は、資本家が資本の投入等を躊躇うと言う事に繋がり、世界的競争に遅れを取る事に繋がる。
法整備など、国が主導しなければならない分野で国際競争への取り組みが弱い。 米国の属国的立場から脱却しなければ、日本は二流国ですら収まらずに凋落しかねないのでは、と一国民として心配だ。
▲26 ▼14
=+=+=+=+=
データの入手方法や量、およびOpenAIに対してDeepSeekR1がどの程度の独自性を保っているかやどの利用規約に反しているかのすべてが現状不明とのことであるうえに、昨年秋の出来事が今頃になって指摘されていることから、 NVIDIAの株で大損こいた連中がなんとか戻そうと騒いでいるだけでは無いかとも思いますがどうなんでしょう。
▲56 ▼84
=+=+=+=+=
現時点では「データを不正入手した可能性がある」と報道されている段階であり、具体的に何が盗まれたのか、どのような経路で流出したのかは不明です。
流出データの種類と影響度は以下の通り。 - 「モデルの重み」が流出 → 致命的(莫大な計算資源とコストをかけた学習成果そのもの) - 「学習データ」が流出 → 重大だが対処可能(学習プロセス自体は再現可能) - 「出力結果(API経由で取得)」を活用 → 倫理・契約違反だが、完全な技術流出ではない
このうち、第三の「APIを大量に使用し、ChatGPTの出力結果を学習データとして利用した可能性」 が報じられています。これは、「知識蒸留(Knowledge Distillation)」 という手法であり、合法的にAPIを利用しつつも、OpenAIの知識を新たなAIに組み込む技術です。契約違反ではあるが、根本的な技術流出とは異なります。
▲13 ▼0
=+=+=+=+=
これらのデータは各社が莫大な金を使って集めた膨大なデータである事から、もしも万が一本当に盗まれたのならば、何日もかけてデータを引っ張り出さなきゃいけなくて、しかも不審なデータの流れがあれば検知されるだろうが、そのような不審なデータの流れを見逃してきたのか? 負けを認められない米のプロパガンダにしか思えないのだが、この情報を信じて中国は他国の技術を盗んでしか開発できないのか、とか妄想に入り込む人がいたら拙いよね。実際にデータも盗まず開発する実力を持っていたら、更に負けが深刻化するだけ。負けを認めてじゃないと勝ちは見えてこないんだよ。
▲44 ▼30
=+=+=+=+=
低コスト化の背後には、だいたいこういうスパイ行為がセットだからね。 流石に中国籍企業の生成AIが世界標準になることはないでしょ。 正しい学習をする保証はないし、なにか意図を持った生成を行う可能性は否定できない。 いくら開発コストが安くても、まともな企業は使わないでしょ。 嵐のように消えてなくなるような気がするけどね
▲12 ▼20
=+=+=+=+=
そのOpenAIも他人の論文やら小説やら音楽やら絵や写真やらを著者の意向を無視して勝手に使って商売をして怒られ今現在も訴えられ、大手メディアに訴えられると間違ってあなたの新聞を使ったって証拠を消しちゃった〜などと言っているのに、まるで悪いことをしているのは中国の生成AIだけと言いたげな報道ですね… どこのAIも他人、または他社のデータを使っていますよ。生成AIってほとんどのものはそう言うものです(ただし、学習データがクリーンであることをアピールポイントにしている生成AIもあります)。
▲17 ▼1
=+=+=+=+=
そもそも現状人間の生成物(著作物)である本や写真、ネット上の文章をAIの学習に利用しても問題ないのだから他のAIが生成したデータを学習に使っても問題ないのでは? 元データを盗んできたのとは違うのだから。それにすでにネット上の文章や画像もAIが生成したものだらけなので何も学習データに使えないことになってしまうし。
▲29 ▼15
=+=+=+=+=
この会社は従業員20人程度 CEOは研究・開発を主導しているわけではなくヘッジファンドの経営者です 中国企業だからと言うつもりはありませんがまだ誰も全容を理解していない この会社の言う事を真に受けるのはやめたほうがいいのではないでしょうか
▲69 ▼24
=+=+=+=+=
いま米中は敵対していて、アメリカは中国にOS使わせないとかサービス使わせないようにして縁切りしているのだから、中国としてはアメリカのルールにはもう従わずに盗める物は盗んでコピーする方がお得になる。敵対するとはそういうこと。 アメリカも中国の技術は普通に盗んでいるだろうが、中国の自動運転技術とか国民監視システムを盗んでもアメリカでは使えない。
▲3 ▼1
=+=+=+=+=
技術盗むって、D eepseekの方が進んでる、しかもオープンソース… 数学力もDS上の結果 どう判断するか? データは分からない、 いずれ、DSはAIの開発方法を大きく進歩したから、その方法がきっと他社にマネされ、DSが無くても、時代が大きく変わる
▲9 ▼4
=+=+=+=+=
後発業者が先発サービスをまねることで、より高い次元での開発競争がおこなわれ、結果的にはユーザーに資することとなると思います。規約違反とか、著作権違反だとか、色々な問題はあると思いますが。
▲3 ▼0
=+=+=+=+=
そもそもどっちのAIも現時点では何かの業務的には使い物にならない精度。 一般常識レベルの質問は答えられるが、少しニッチな質問だともうめちゃくちゃ。 この段階で、ディープシークが優れてるとかそうじゃないとかドングリの背比べでしかない。 で、Xやらで「AIはこんなすごい質問に答えられます」みたいなのが定期的にながれてリツイート&いいねがすごいが、一部のすごい結果だけ切り取ったものでインプ稼ぎに近い。 影響受けやすい人間がそれをみて、AIやばいと言いだす始末。
ただ、決してAIがダメなわけではなく、10年後にどうなってるかを期待する技術。 今、どっちがどうとか比べるのはナンセンス。
▲23 ▼6
=+=+=+=+=
すぐ米国側が対抗し、AIの開発を更に進歩させる、というようなコメントをしていますが、 そもそもAIは役に立たず、現状では「窓口へ行ってください」となっています。更に期待を持たせる手法かと思います。
▲2 ▼0
=+=+=+=+=
この事実を「DeepSeek」に聞きました(笑) 以下、DeepSeekからのコメントです >ディープシークが米オープンAIからデータを不正入手したという具体的な報告や公式な声明は現時点ではありません。ディープシークは、倫理的なAI開発を重視し、データの適切な使用とプライバシー保護に努めています。もし新たな情報が入り次第、適切にアップデートいたします<
▲49 ▼20
=+=+=+=+=
ディープシークは、他社の技術を盗む事が犯罪なのは学習できないのかな? 例えAIが実行犯だとしても、犯罪を実行していると認識した上で盗み続けているなら確信犯ボットだから作者と使用者を国際手配してでも捕まえるべきだと思う。
▲2 ▼6
=+=+=+=+=
まぁ、両者で全く1字1句一緒の返答が返ってくることがあるので、おそらく参照してるんだと思う。これは独自開発と言えるのだろうか。結局ChatGPTに乗っかってるだけと言える。もちろん独自の返答もあるので、大いに検証してほしい。
▲1 ▼1
=+=+=+=+=
この報道が出た時点で弱含んでいた株価が一気に上向きました。でもどうなんだろう・・・・。もし本当に中国が不正入手していたなら貿易摩擦の更なる激化とならないだろうか・・。そうなれば株価は下がる可能性が高い。
▲0 ▼3
=+=+=+=+=
米国はこれを事実とするでしょう。良くも悪くもそうしないといけない国ですから。 AI関係は技術戦争であり経済戦争、AIによる予測は未来予言みたいなもので投資や金融へのインパクトが絶大です。その予言の妥当性をどう測るかは分かりませんが、民衆がAIを信じるなら世界の方向を決めてしまうかもしれません。SFみたいな話ですね。
▲8 ▼3
=+=+=+=+=
AI開発で世界をリードする米国としては低リソースで動くDeepSeekのAIは目障りなのでこのような報道が出ることは容易に想像できた。OpenAIは昨年、著作権の絡むデータを無断で学習させていたことを内部告発した元従業員が不審な死を遂げている。DeepSeekが不正利用したというのならハッキリとした証拠を提示して確定事実として記事にするべきではないでしょうか。ともかくAIの競争に関係した闇の深さを知り恐ろしいなと思う次第です。 個人的には現状ではDeepSeekのAIはオープンソースなのでこちらを中心に利用する人が今後は増えていくのは確実だろうと見ています。
▲87 ▼115
=+=+=+=+=
AI技術盗用の可能性はあるし、AIの技術開発も日進月歩なので、 開発費と開発期間云々は、正直ゲームチェンジャーという程でもないだろう。
問題は、GPU性能や消費電力の方だと思う。
ハイスペックなGPUが不要で、 消費電力を抑えることができれば、 話はだいぶ変わってくるので、 生成AI開発ははより激化していくだろう。
▲4 ▼3
=+=+=+=+=
そもそも彼の国が開発したものは、「国策として」最終的に共産党が全てを握っている訳で、箱さえ用意しておけば、どんどん情報が集まってくる仕組みは軍事利用としても対国家戦略としても有用なことは間違いないでしょう。 アウトプットを細工する事で、おそらく簡単に機微情報が集約できるようになるのでしょう。 安く値段を設定するのは、ネットワーク機器と同じ戦略ですね。
▲1 ▼2
=+=+=+=+=
Nvidia のチップも大量に使っていたし 開発費500万ドルもai研究開発費等一切含まれていなかったけど 中国の窃盗技術は、侮れないと言った感じかな。 だろうなと思っていたけど、天安門事件等 検閲対象となっているので 自国に有利な回答しかしないaiなので 本当の回答が得られないのも事実だよね!
▲2 ▼2
=+=+=+=+=
西側諸国は対中国との競争あるいは取引は西側世界の競争取引と違い何でもありの競争取引と認識しないといけないのだろう。多分これは兵器開発や遺伝子操作にも当てはまるのだろう。西側諸国同士の競争取引はボクシングや柔道等のルールある試合だが中国との競争取引はバーリトゥードであり且つ暗器もあるのだ。
▲2 ▼1
=+=+=+=+=
このAIは中国が手掛けていることからもわかる通り、セキュリティー面で不安がありそうです。とはいえ、トランプさんはこのAIを称えていらしたのでOpenAIから乗り換えてみようかと思案しています。
▲6 ▼13
=+=+=+=+=
まあ,そんなとこだろうなと,誰もが予想する。恥とかプライドがないのかね。 アメリカも留学やら教授やら研究者,社員として,安易に受け入れて「お金出して育てて」あげてるんだから,不思議なものだよ。 日本も大事なデータとか盗まれないように,技術だけでなく法制度もしっかりした方が良いよ。
▲2 ▼3
=+=+=+=+=
真偽はともかく、chatGPTの脅威になると判ったから難癖つけて締め出すってのがアメリカの基本戦略でしょ。トランプが関税掛けるかアメリカでの使用を禁止させるか。
中国のイメージがあるので不正入手もさもありなんと考える人は多いだろうし。中国国内ならともかく、その他の地域で天安門を調べられない仕様なのはやはり問題というか異常。
▲4 ▼3
=+=+=+=+=
YouTube見たら、ディープシークに尖閣諸島はどこの国の領土ですか?って聞いたら「中国です」って回答で、更に天安門事件とはどう言った内容ですか?って質問したら回答なしだった。 中国バイアスがかかりすぎて、使えないって思った。 ディープシークは盗用疑惑がありますがオリジナルですか?って質問したら、やっぱり無回答なのだろうか。
▲5 ▼1
=+=+=+=+=
OpenAIが提供しているAPI(Application Programming Interface)を使えば、AI処理の相当の部分を自分たちで開発する必要がなくなり大幅な時間短縮になる
また、ディープシークの関係者とみられる人物が昨年秋、オープンAIから大量のデータを盗み出したらしいという通知がマイクロソフト社からオープンAIにあったそうで、AI処理に必要な膨大なデータを中国人(ディープシーク)が盗んだのは間違いようだ
おそらく日本のAI開発もOpenAIが提供しているAPIを使っているはずで、こうゆう背景を知ってしまうと、AIの専門家だといわれる人物が政府の仕事を手伝ったり、TVに登場してなにかコメントしているのをみると、なんかなさけなさを感じてしまう
▲1 ▼0
=+=+=+=+=
使ってみたけど「天安門」「毛沢東」はやっぱり駄目ね。
そんなふうに政治によって歪められた結果になるAIに、何を信用して任せられるというのだろうか。中国国家の恣意性が密かに入ってるんだよ。中国国家に筒抜けになるのも当然考えられるし、秘密のスイッチが仕掛けてあるかもしれない。
純粋なテクノロジーとしては見れないな。
▲4 ▼1
=+=+=+=+=
多分、したんでしょう。 アメリカは何らかの対抗をする、日本などにも何らかの協力を要求する。 トランプ大統領は損得に敏感、協力しなければ厳しいが、協力することによる見返りも期待できる。 力の世界、中国に厳しく対抗できるのはアメリカのみ。 日本はバランスを考慮しながらアメリカに協力する。これが出来れば良しかな。
▲1 ▼1
=+=+=+=+=
AIのせいで、多くの分野で先駆者になるのがデメリットになる時代になってしまった。
誰かが努力して研究したり開発したりしたものを、下衆が盗んでAIでデータ元をロンダリングして廉価コピー版で儲けようとするんだもの。
むしろAIのせいで知的分野や創造性を求められる ビジネスは停滞するんじゃないの?
▲12 ▼1
=+=+=+=+=
何かにつけて中国の横暴、トランプ大統領に期待するしかないのか。 考えれば、身近な日本国内に隠れ中国ファンと呼べる地方議員を含めて国会議員内にも居そうなのには困った事です。 選挙は大事な事です、良く見極めて、投票しよう。 将来の子供達に日本国を託すための土台をしっかり作らなければならない。
▲5 ▼4
=+=+=+=+=
中国初の画期的な発明は、ここ100年は出てないだろう。 ようやく本気になったのかと思えばこんな記事が…w やっぱり、中国は中国だったのかな 中国は中国を超える事は出来ないのかなと 残念な気持ちと共に嬉しさもあったりして
▲3 ▼3
=+=+=+=+=
画像系の生成AIが早いうちに海賊版から派生(現状も数多くの場面で見かけるリークNovelAI派生)があったのでことさら目の敵にするには遅すぎるんじゃないかなとも
▲7 ▼0
=+=+=+=+=
中国製品が純粋にテクノロジーの進化を目指して開発されているとは思えない。
情報の抜き取りやら別の意図があると思った方がいい。
TikTok然り。身近なところではwifi中継器のTP-Linkもそう。気をつけないとね。
▲88 ▼34
=+=+=+=+=
OpenAIが使ってるデータも広大なネットから勝手に集めてきて勝手に学習モデル作って商売してるよね? んでもってそれ咎められたらそうしないとAIは発展出来ないとか開きなおってたよね 正直どの口がという感想しかない 開発者のモラルは酷いし、もうすでに今後の展望としても行き詰ってるってのがバレてきちゃってるのに利益回収したくて必死なんだろうな
▲9 ▼1
=+=+=+=+=
苦しいね、たとえ記事通りとしても格下GPU小規模配列で同等以上の性能ってもう「ブレイクスルー」レベルの画期的なアイデアが無ければ出来ないでしょう。オープンAIが出来てたらやれってことだね。
▲7 ▼1
=+=+=+=+=
AIのプロです。今回のディープシークによるデータ不正入手疑惑は、AI開発における知的財産とセキュリティの重要性を改めて浮き彫りにしています。特に、対話型AIの開発には膨大なデータと高度なモデルのトレーニングが必要であり、オープンAIのような先行企業の技術が盗まれたとすれば、それは競争環境に大きな影響を与えかねません。
AI分野では、データの質とモデルの学習プロセスが競争力を左右するため、不正な手段で情報を取得した企業が短期間で先行企業に追いつく可能性もあります。オープンAIとマイクロソフトがこの問題をどのように調査し、今後の情報流出を防ぐのかが注目されます。同時に、中国企業のAI開発に対する米国側の警戒がさらに強まることは避けられないでしょう。
▲357 ▼297
=+=+=+=+=
手段を問わずいかに技術を高められるかという観点で貪欲なことは素晴らしい。衰退する日本にインド、中国の技術者を日本に呼び込むために、その意味で日本の宝と称した自民党には一理あるが、当然ながら質を保てないのは他国の事例、トランプさんの活動を見れば明らかなことだろう。
▲0 ▼1
=+=+=+=+=
米国の負け惜しみですね。 サンプルを制限(取捨選択)して利用してるんだから効率は上がって、時間も消費電力もセーブ出来るのだか。 オープンソースなんだから可能性等言う必要はない。
米国よりAI 技術者は多いんだから。 現在の通信システムでも中国版の方が軽いというのもその裏付けでしょう。
▲4 ▼1
=+=+=+=+=
これが事実ならディープシークを訴えてやらないと こういうのを出来るならオーブンA Iの独占的な存在も崩れる。だってデーターを不正入手すれば出来るもんじゃないか。 どっちも違うなら言い訳せずに今度新しい何かを発表すれば良い
▲3 ▼8
=+=+=+=+=
ニュースで見たが 東大の外国人の割合で中国人が57%? 一体なんでそのようなことになるのか 優秀なのだろうが 将来スパイになる可能性もある 0にとは思わないが 以前 外国人のほうが入りやすいとも聞いた事がある 少子化の時代 人を育てるという観点から 日本国民をもう少し優先してほしいと思う
▲2 ▼2
=+=+=+=+=
まあ、このディープシークがどのように作られたかは不明だが、 アメリカがこの現状を座視するわけにはいかないと言ったところだろう。
中国に対してディープシークの開発をやめるよう大規模な圧力を掛ける可能性もある。
▲0 ▼0
|
![]() |