1985年生まれの梁氏は、中国南東部の広東省で育った。中国の名門である浙江大学に進学し、マシンビジョンを専攻した。卒業後数年経った2015年、大学時代の友人2人と共に幻方量化を設立した。
幻方量化は2019年、金融事業で得た資金の一部を使って、AI研究用のチップクラスターの構築を開始した。その後、大規模言語モデル(LLM)のトレーニングに使用できる約1万個の米エヌビディア製GPU(画像処理半導体)から成る、より大規模なクラスターを構築した。
ディープシークの旗艦AIモデルは無料だが、自社のアプリケーションをディープシークのAIモデルやコンピューティングインフラに接続する企業には料金を請求している。例としては、顧客からの問い合わせにAIによる回答を提供するために、この技術を活用したい企業などが挙げられる。
2024年初め、ディープシークはこのサービスの料金を大幅に下げて、中国の業界全体で価格競争が始まるきっかけを作った。
米政府の対中規制下で「画期的な進歩」
ディープシークは技術リポートの中で、V3モデルのトレーニングには約2000個のエヌビディア製チップのクラスターを使用したと述べている。しかし、同様の規模のモデルのトレーニングには数万個のチップが使われる。これが専門家を驚かせている理由の1つだ。一部の専門家は、ディープシークが公表している以上の計算能力にアクセスしているのではないかと疑っている。
2025年1月20日にリリースされた最新のR1について、同社はプログラマーが人間の専門家の知識をモデルに組み込んで先行学習を行う「教師ありファインチューニング(SFT)」というプロセスを省略したと説明した。同社によれば、それにもかかわらず、R1の性能はオープンAIの「o1(オーワン)」と同等なのだという。
WSJによると、これについてエヌビディアの研究員であるジム・ファン氏は「画期的な進歩だ」と称賛した。オープンAI元幹部のザック・カス氏は米政府の対中規制下でディープシークに進展があったことについて「重要な教訓だ。リソースの制約は時として創造性を生む」との考えを示した。