paint-brush
現実世界の AI タスクにおける ChatGPT、Qwen、DeepSeek のベンチマーク@decodebuzzing
490 測定値
490 測定値

現実世界の AI タスクにおける ChatGPT、Qwen、DeepSeek のベンチマーク

HarshVardhan Jain17m2025/02/03
Read on Terminal Reader

長すぎる; 読むには

ChatGPT、Qwen、DeepSeek は、最も人気のある 3 つの AI モデルです。一連の重要な課題でこれらのモデルをテストしました。結果から、どのモデルがニーズ (および予算) に最も適しているかがわかります。
featured image - 現実世界の AI タスクにおける ChatGPT、Qwen、DeepSeek のベンチマーク
HarshVardhan Jain HackerNoon profile picture
0-item
1-item
2-item
3-item

コーディング、メカニズム、アルゴリズムの精度で優れた AI モデルはどれですか? 現実世界の精度を実現するモデルはどれですか?

かつては米国の裕福なテクノロジー大手が AI 市場を独占していたが、DeepSeek のリリースは業界に波紋を呼び、大きな話題を呼んだ。しかし、それだけでは十分ではなかったかのように、Qwen 2.5 が登場し、複数の分野で DeepSeek を上回った。DeepSeek-R1 や OpenAI の O1 などの他の推論モデルと同様に、Qwen 2.5-Max は思考プロセスを隠す方法で動作し、意思決定ロジックの追跡を困難にしている。


この記事では、微積分問題の解決からコードのデバッグまで、一連の重要な課題でChatGPT、Qwen、DeepSeekの性能を検証します。完璧なAIコーディングアシスタントを探している開発者量子力学に取り組む研究者ビジネスプロフェッショナルなど、今日はどのモデルがあなたのニーズ(および予算)にとって最も賢い選択であるかを明らかにしたいと思います。


AIモデル機能の比較分析:-

1. チャット

OpenAIが開発したChatGPTは、強力なGPT-5アーキテクチャ上に構築され、人間のフィードバックからの強化学習(RLHF)を使用して微調整されており、AI分野で依然として支配的な勢力であり続けています。クリエイティブライティングから技術文書作成まで、さまざまなタスクに頼ることができるため、コンテンツクリエイター、教育者、スタートアップ企業にとって最適な選択肢となっています。ただし、完璧というわけではありません。高度な数学やニッチな法律分野などの専門分野になると、苦戦する可能性があります。さらに、インフラストラクチャのコストが高いため、中小企業や個人の開発者が簡単にアクセスすることは困難です。


30億ドル以上の巨額の投資で構築されたChatGPTは大規模なインフラストラクチャモデルですが、DeepSeekはわずか560万ドルで同様のパフォーマンスを達成しました。まさに中国の典型ですね。


2. ディープシーク

DeepSeek は、計算精度と効率性を重視し、既存の大手企業に挑戦する AI レースのダークホースとして突如登場しました。

競合他社とは異なり、DeepSeekは科学的および数学的なタスク向けにカスタマイズされており、 arXivやWolfram Alph aなどのトップデータセットでトレーニングされているため、最適化、物理シミュレーション複雑な数学の問題などの分野で優れたパフォーマンスを発揮します。DeepSeekの真の強みは、その安さです(中国のしゃれではありません😤)。ChatGPTやQwenなどのモデルは膨大なリソースを必要としますが、Deepseekははるかに少ないコストでその仕事をこなします。つまり、ChatGPTのサブスクリプションに1000ドルを支払う必要はありません。


DeepSeek の応答方法は少しロボット的な感じがして、あまり技術的でないタスクにはうまく適応しません。数学や研究などの特定の分野には最適ですが、カジュアルな会話やクリエイティブな会話には適していません。

3. クウェン

Deepseek の後、別の中国の AI が現れて支配権を握り始めるなんて誰が想像したでしょうか? 典型的な中国のやり方です。何かを広めるのです。今回は AI です (笑)

Qwen は多言語設定でビジネスゲームを支配しており、特に北京語とアラビア語でアジアなどの地域で優れています。法律や財務のタスクに頼っており、DeepSeek R1 のような推論モデルではないため、思考プロセスを見ることはできません。しかし、DeepSeek と同様に、ロボットのような雰囲気があり、カジュアルまたはクリエイティブな作業にはそれほど楽しくありません。より柔軟なものが必要な場合は、Qwen は最適な選択肢ではないかもしれません。


それを専門家のチームのように考えることができます。物理学に関する複雑な質問をすると、物理学の専門家だけが応答し、チームの残りのメンバーは何もしません。


テストの時間: 3 つの AI を現実の問題と比較する

公平性と徹底した評価を確保するために、難しい数学の問題、ワイルドな物理学の問題、コーディングタスク、トリッキーな現実世界の質問など、最も話題になっている課題をいくつか投げかけてみましょう。

— — — — — — — — — — — —

1. 物理学: 回転するボールの問題

まず、古典的な「箱の中のボールを回転させる」問題に取り組みましょう。これは、さまざまなAIモデルが複雑なタスクをどれだけうまく処理できるかをテストするための一般的なベンチマークとなっています。

課題: 物理法則に従いながら回転する箱の中でボールが跳ねる様子をシミュレートする

空間内で回転する2D形状を想像してください。内部では、ボールが壁から跳ね返り、境界内に留まり、外部からの力を受けません。一見すると単純に思えるかもしれませんが、重力、一定の回転、正確な衝突ダイナミクスを考慮すると、難しいシミュレーションになります。AIモデルがこれにどのように取り組むかに驚かれることでしょう。

プロンプト:-

 Write a Python script that simulates a yellow ball bouncing inside a rotating square. The ball should bounce realistically off the square's edges, with the square rotating slowly over time The ball must stay within the square's boundaries as the box rotates. Box Rotation: The box should rotate continuously. Ball Physics: The ball reacts to gravity and bounces off the box's walls. Ball Inside Boundaries: Make sure the ball doesn't escape the box's boundaries, even as the box rotates. Realistic Physics: Include proper collision detection and smooth animation Use Python 3.x with Pygame or any similar library for rendering


結果:


1. ChatGPTの出力:高速だが欠陥あり

Chatgpt には大きな期待を抱いていました。しかし、結果は…期待外れでした。DeepSeek は精度を上げるのに時間がかかりましたが、ChatGPT はすぐにきれいなスクリプトを吐き出しました。ボールはリアルに跳ね返りませんでした。代わりに、ボックスの端でグリッチし、角に引っかかったり、壁を通り抜けたりしました。ChatGPTは深さよりもスピードを重視し、機能するソリューションを提供していますが、それは最も基本的な意味でのみです。

Chatgptのコード:

 import pygame import math # Initialize Pygame pygame.init() # Constants WIDTH, HEIGHT = 600, 600 FPS = 60 GRAVITY = 0.2 BOUNCE_DAMPING = 0.8 ROTATION_SPEED = 0.5 # Degrees per frame BALL_RADIUS = 10 # Colors YELLOW = (255, 255, 0) WHITE = (255, 255, 255) BLACK = (0, 0, 0) # Screen setup screen = pygame.display.set_mode((WIDTH, HEIGHT)) clock = pygame.time.Clock() # Square properties square_center = (WIDTH // 2, HEIGHT // 2) square_size = 300 angle = 0 # Ball properties ball_pos = [WIDTH // 2, HEIGHT // 2 - 50] ball_velocity = [2, 0] # Function to rotate a point around a center def rotate_point(point, center, angle): x, y = point cx, cy = center radians = math.radians(angle) cos_a, sin_a = math.cos(radians), math.sin(radians) new_x = cos_a * (x - cx) - sin_a * (y - cy) + cx new_y = sin_a * (x - cx) + cos_a * (y - cy) + cy return new_x, new_y # Main loop running = True while running: screen.fill(BLACK) for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Apply gravity ball_velocity[1] += GRAVITY # Move ball ball_pos[0] += ball_velocity[0] ball_pos[1] += ball_velocity[1] # Compute rotated square corners half_size = square_size // 2 square_corners = [ (-half_size, -half_size), (half_size, -half_size), (half_size, half_size), (-half_size, half_size) ] rotated_corners = [rotate_point((square_center[0] + x, square_center[1] + y), square_center, angle) for x, y in square_corners] # Check for collisions for i in range(4): p1, p2 = rotated_corners[i], rotated_corners[(i + 1) % 4] dx, dy = p2[0] - p1[0], p2[1] - p1[1] length = math.hypot(dx, dy) normal = (-dy / length, dx / length) # Perpendicular normal # Distance from ball to edge projection = (ball_pos[0] - p1[0]) * normal[0] + (ball_pos[1] - p1[1]) * normal[1] if projection < BALL_RADIUS: # Ball is colliding with edge # Reflect velocity dot = ball_velocity[0] * normal[0] + ball_velocity[1] * normal[1] ball_velocity[0] -= 2 * dot * normal[0] ball_velocity[1] -= 2 * dot * normal[1] # Apply bounce damping ball_velocity[0] *= BOUNCE_DAMPING ball_velocity[1] *= BOUNCE_DAMPING # Move ball out of collision ball_pos[0] += normal[0] * (BALL_RADIUS - projection) ball_pos[1] += normal[1] * (BALL_RADIUS - projection) # Rotate square angle += ROTATION_SPEED # Draw rotated square pygame.draw.polygon(screen, WHITE, rotated_corners, 2) # Draw ball pygame.draw.circle(screen, YELLOW, (int(ball_pos[0]), int(ball_pos[1])), BALL_RADIUS) # Update display pygame.display.flip() clock.tick(FPS) pygame.quit()


出力:

2. ディープシーク

DeepSeekの出力には本当に驚きました。ChatGPTはコードを素早く生成しましたが、DeepSeekは問題について考えるだけで200秒もかかりました。DeepSeekは単に機能的なスクリプトを書いたのではなく、あらゆるエッジケースを完璧に処理する、高度に最適化された物理的に正確なシミュレーションを作成しました。


DeepSeekのコード:

 import pygame import math # Initialize Pygame pygame.init() # Constants WIDTH, HEIGHT = 600, 600 SQUARE_SIZE = 400 SQUARE_HALF = SQUARE_SIZE // 2 BALL_RADIUS = 10 GRAVITY = 0.5 RESTITUTION = 0.8 ANGULAR_VELOCITY = 1 # Degrees per frame # Setup display screen = pygame.display.set_mode((WIDTH, HEIGHT)) pygame.display.set_caption("Bouncing Ball in Rotating Square") clock = pygame.time.Clock() # Initialize variables square_center = (WIDTH//2, HEIGHT//2) angle = 0 ball_pos = [WIDTH//2, HEIGHT//2] ball_vel = [0, 0] def rotate_point(point, center, angle): """Rotate a point around a center by given angle (degrees)""" theta = math.radians(-angle) ox, oy = center px, py = point qx = ox + math.cos(theta) * (px - ox) - math.sin(theta) * (py - oy) qy = oy + math.sin(theta) * (px - ox) + math.cos(theta) * (py - oy) return qx, qy running = True while running: dt = clock.tick(60) / 1000 # Delta time in seconds # Event handling for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Update square rotation angle = (angle + ANGULAR_VELOCITY) % 360 # Apply physics ball_vel[1] += GRAVITY ball_pos[0] += ball_vel[0] * dt ball_pos[1] += ball_vel[1] * dt # Collision detection and response # Convert ball position to square's local coordinate system translated = (ball_pos[0] - square_center[0], ball_pos[1] - square_center[1]) rotated = rotate_point((translated[0], translated[1]), (0, 0), -angle) collision = False new_local_x, new_local_y = rotated[0], rotated[1] # Check boundaries in local coordinates if rotated[0] < -SQUARE_HALF + BALL_RADIUS: new_local_x = -SQUARE_HALF + BALL_RADIUS collision = True elif rotated[0] > SQUARE_HALF - BALL_RADIUS: new_local_x = SQUARE_HALF - BALL_RADIUS collision = True if rotated[1] < -SQUARE_HALF + BALL_RADIUS: new_local_y = -SQUARE_HALF + BALL_RADIUS collision = True elif rotated[1] > SQUARE_HALF - BALL_RADIUS: new_local_y = SQUARE_HALF - BALL_RADIUS collision = True if collision: # Convert corrected position back to global coordinates corrected = rotate_point((new_local_x, new_local_y), (0, 0), angle) ball_pos[0] = corrected[0] + square_center[0] ball_pos[1] = corrected[1] + square_center[1] # Calculate reflection in local coordinates local_vel = rotate_point(ball_vel, (0, 0), -angle) if new_local_x != rotated[0]: # X-axis collision local_vel = (-local_vel[0] * RESTITUTION, local_vel[1]) if new_local_y != rotated[1]: # Y-axis collision local_vel = (local_vel[0], -local_vel[1] * RESTITUTION) # Convert velocity back to global coordinates global_vel = rotate_point(local_vel, (0, 0), angle) ball_vel[0], ball_vel[1] = global_vel[0], global_vel[1] # Drawing screen.fill((0, 0, 0)) # Draw rotating square square = pygame.Surface((SQUARE_SIZE, SQUARE_SIZE), pygame.SRCALPHA) pygame.draw.rect(square, (255, 0, 0), (0, 0, SQUARE_SIZE, SQUARE_SIZE), 2) rotated_square = pygame.transform.rotate(square, angle) screen.blit(rotated_square, rotated_square.get_rect(center=square_center)) # Draw ball pygame.draw.circle(screen, (255, 255, 0), (int(ball_pos[0]), int(ball_pos[1])), BALL_RADIUS) pygame.display.flip() pygame.quit()

出力:

3. クウェンの成果:残念な試み

ChatGPT の出力が期待外れだったとしたら、 Qwen はまったく期待外れでした。Qwen は複雑なタスクの処理で高い評価を得ていたため、そのパフォーマンスには本当に大きな期待を抱いていました。しかし、回転ボールのシミュレーションのコードを実行したところ、結果は期待とはかけ離れていました。ChatGPT と同様に、Qwen は深く考える必要もなく、ほぼ瞬時にコードを生成しました。

シミュレーションのほとんどの間、ボールはボックスの外側にあり、物理法則に完全に反していました。ボックス自体は半分フレームから外れていたため、キャンバス上にはその一部しか見えませんでした。

クウェンの掟

import pygame import math # Initialize Pygame pygame.init() # Screen dimensions WIDTH, HEIGHT = 600, 600 screen = pygame.display.set_mode((WIDTH, HEIGHT)) pygame.display.set_caption("Bouncing Ball in Rotating Square") # Colors YELLOW = (255, 255, 0) WHITE = (255, 255, 255) BLACK = (0, 0, 0) # Clock for controlling frame rate clock = pygame.time.Clock() FPS = 60 # Box properties box_size = 300 box_center = (WIDTH // 2, HEIGHT // 2) angle = 0 # Initial rotation angle rotation_speed = 1 # Degrees per frame # Ball properties ball_radius = 10 ball_pos = [box_center[0], box_center[1] - box_size // 4] # Start near the top center of the box ball_velocity = [4, 0] # Initial velocity (x, y) gravity = 0.2 # Gravity effect # Function to rotate a point around another point def rotate_point(point, angle, origin): ox, oy = origin px, py = point qx = ox + math.cos(math.radians(angle)) * (px - ox) - math.sin(math.radians(angle)) * (py - oy) qy = oy + math.sin(math.radians(angle)) * (px - ox) + math.cos(math.radians(angle)) * (py - oy) return qx, qy # Main game loop running = True while running: screen.fill(BLACK) # Handle events for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Update ball physics ball_velocity[1] += gravity # Apply gravity ball_pos[0] += ball_velocity[0] ball_pos[1] += ball_velocity[1] # Rotate the box angle += rotation_speed if angle >= 360: angle -= 360 # Define the four corners of the square corners = [ (-box_size / 2, -box_size / 2), (box_size / 2, -box_size / 2), (box_size / 2, box_size / 2), (-box_size / 2, box_size / 2) ] # Rotate the corners around the center rotated_corners = [rotate_point(corner, angle, box_center) for corner in corners] # Check collision with the edges of the box collided = False for i in range(4): p1 = rotated_corners[i] p2 = rotated_corners[(i + 1) % 4] # Line segment between p1 and p2 x1, y1 = p1 x2, y2 = p2 # Closest point on the line to the ball dx = x2 - x1 dy = y2 - y1 t = max(0, min(1, ((ball_pos[0] - x1) * dx + (ball_pos[1] - y1) * dy) / (dx * dx + dy * dy))) closest_x = x1 + t * dx closest_y = y1 + t * dy # Distance between ball and closest point distance_sq = (closest_x - ball_pos[0]) ** 2 + (closest_y - ball_pos[1]) ** 2 if distance_sq <= ball_radius ** 2: # Collision detected collided = True # Normal vector of the edge edge_length = math.hypot(dx, dy) nx = -dy / edge_length ny = dx / edge_length # Reflect the velocity vector dot_product = ball_velocity[0] * nx + ball_velocity[1] * ny ball_velocity[0] -= 2 * dot_product * nx ball_velocity[1] -= 2 * dot_product * ny # Ensure the ball stays inside the box if not collided: # Clamp the ball position within the box ball_pos[0] = max(box_center[0] - box_size / 2 + ball_radius, min(ball_pos[0], box_center[0] + box_size / 2 - ball_radius)) ball_pos[1] = max(box_center[1] - box_size / 2 + ball_radius, min(ball_pos[1], box_center[1] + box_size / 2 - ball_radius)) # Draw the rotating square pygame.draw.polygon(screen, WHITE, rotated_corners, 2) # Draw the ball pygame.draw.circle(screen, YELLOW, (int(ball_pos[0]), int(ball_pos[1])), ball_radius) # Update the display pygame.display.flip() # Cap the frame rate clock.tick(FPS) # Quit Pygame pygame.quit()


2.古典的な追跡パズルに対する ChatGPT、Qwen、DeepSeek の応答の比較

現実世界の問題を解決する場合、すべての AI モデルが同じように作られているわけではありません。その能力をテストするために、私は典型的な追跡問題を提示しました。


「貴重な品物が盗まれました。持ち主は、泥棒がすでに 45 km 逃走した後、追跡を開始しました。160 km 移動した後、持ち主は泥棒が 18 km 先に残っていることを発見しました。泥棒を捕まえるには、あと何 km 移動する必要がありますか?」


1. ChatGPTの対応

ChatGPTは正しい答えに到達するまでに3回の試行を要した。最初は問題を誤解していたが、最終的には自ら修正し、最初の試行では効率が悪かったものの粘り強さを示した。


2. DeepSeekの対応

DeepSeekも1回目の試行で正解しましたが、Qwenより少し時間がかかりました。明確な理由とともに詳細で段階的な解決策を提示し、深い思考と正確さの強さを証明しました。


2. クウェンの反応

Qwen は1 回目の試行で正解し、DeepSeek よりも速く回答しました。Qwen は、不要な手順を踏まずに簡潔で正確なソリューションを提供し、問題解決のスピードと精度の高さを示しました。


結論

3つのAIは最終的に正解したが、 Qwenはスピードと効率性で際立っており、 DeepSeekは系統的なアプローチを披露した。ChatGPT複数回の試行が必要だった。


AI コンテンツの人間化: AI の人間的側面

AIではスピードと効率が重視されることが多いが、本当のゲームチェンジャーは感情知能、つまり人間の感情を理解し、解釈し、反応する能力だ。DeepSeekのようなAIモデルは精度と論理に優れ、ChatGPTは創造性に優れている。試してみよう

— — — — — — — —

プロンプト: Write a messy emotional love letter

— — — — — — — —


チャット内容:


ディープシーク:

クウェン:

興味深いことに、人間のような独創性をテストしたところ、ChatGPT、DeepSeek、Qwen の 3 つのモデルすべてが、AI が生成したパターンから抜け出すのに苦労しました。注: 3 つすべてが、同じロボットのようなセリフで応答を開始しました。 「どこから始めればいいのかさえわかりません」 いずれにしても、私は Chatgpt に大きな期待を寄せていましたが、Qwen が勝ちました。


重要なポイント:

DeepSeek *:研究批判的思考に最適なツール。精度と深さにおいて他を上回ります。*

Qwen *: 古典的な謎を 1 回目の試行で解くという点で DeepSeek に匹敵し、人間味のあるコンテンツで勝利し、強力なオールラウンダーとなりました。*

ChatGPT *: 謎を解くのに何度も試行する必要がありましたが、創造的なタスク人間のようなやり取りには依然として最適な選択肢です。*


最終判定: 誰がどの AI を使うべきか?

  • 研究者:DeepSeek
  • エンジニア: DeepSeek
  • ライター: ChatGPT または Qwen
  • 弁護士:Qwen withchatgpt
  • 教育者: ChatGPT
  • コンテンツクリエイター:Deepseek の Qwen と deep-thinking

結論:

コメント欄で皆さんの意見を聞き、間違っていたら訂正していただければ幸いです。この記事が役に立ったと思ったら、拍手してシェアして、意見を共有してください。気軽にサポートしてください***ここ***またはUPI: jainhvj@fam


この広大な分野を学び、探求し続けることに興奮しています。皆さんのフィードバックに感謝し、有意義な議論を楽しみにしています。

ありがとう!