現実世界の AI タスクにおける ChatGPT、Qwen、DeepSeek のベンチマーク
2025/02/03
ChatGPT、Qwen、DeepSeek は、最も人気のある 3 つの AI モデルです。一連の重要な課題でこれらのモデルをテストしました。結果から、どのモデルがニーズ (および予算) に最も適しているかがわかります。
コーディング、メカニズム、アルゴリズムの精度で優れた AI モデルはどれですか? 現実世界の精度を実現するモデルはどれですか?

かつては米国の裕福なテクノロジー大手が AI 市場を独占していたが、DeepSeek のリリースは業界に波紋を呼び、大きな話題を呼んだ。しかし、それだけでは十分ではなかったかのように、Qwen 2.5 が登場し、複数の分野で DeepSeek を上回った。DeepSeek-R1 や OpenAI の O1 などの他の推論モデルと同様に、Qwen 2.5-Max は思考プロセスを隠す方法で動作し、意思決定ロジックの追跡を困難にしている。



1. チャット



2. ディープシーク

DeepSeek は、計算精度と効率性を重視し、既存の大手企業に挑戦する AI レースのダークホースとして突如登場しました。

競合他社とは異なり、DeepSeekは科学的および数学的なタスク向けにカスタマイズされており、 arXivやWolfram Alph aなどのトップデータセットでトレーニングされているため、最適化、物理シミュレーション複雑な数学の問題などの分野で優れたパフォーマンスを発揮します。DeepSeekの真の強みは、その安さです(中国のしゃれではありません😤)。ChatGPTやQwenなどのモデルは膨大なリソースを必要としますが、Deepseekははるかに少ないコストでその仕事をこなします。つまり、ChatGPTのサブスクリプションに1000ドルを支払う必要はありません。

DeepSeek の応答方法は少しロボット的な感じがして、あまり技術的でないタスクにはうまく適応しません。数学や研究などの特定の分野には最適ですが、カジュアルな会話やクリエイティブな会話には適していません。

3. クウェン

Deepseek の後、別の中国の AI が現れて支配権を握り始めるなんて誰が想像したでしょうか? 典型的な中国のやり方です。何かを広めるのです。今回は AI です (笑)

Qwen は多言語設定でビジネスゲームを支配しており、特に北京語とアラビア語でアジアなどの地域で優れています。法律や財務のタスクに頼っており、DeepSeek R1 のような推論モデルではないため、思考プロセスを見ることはできません。しかし、DeepSeek と同様に、ロボットのような雰囲気があり、カジュアルまたはクリエイティブな作業にはそれほど楽しくありません。より柔軟なものが必要な場合は、Qwen は最適な選択肢ではないかもしれません。


テストの時間: 3 つの AI を現実の問題と比較する


1. 物理学: 回転するボールの問題


課題: 物理法則に従いながら回転する箱の中でボールが跳ねる様子をシミュレートする



 Write a Python script that simulates a yellow ball bouncing inside a rotating square. The ball should bounce realistically off the square's edges, with the square rotating slowly over time The ball must stay within the square's boundaries as the box rotates. Box Rotation: The box should rotate continuously. Ball Physics: The ball reacts to gravity and bounces off the box's walls. Ball Inside Boundaries: Make sure the ball doesn't escape the box's boundaries, even as the box rotates. Realistic Physics: Include proper collision detection and smooth animation Use Python 3.x with Pygame or any similar library for rendering


1. ChatGPTの出力:高速だが欠陥あり

Chatgpt には大きな期待を抱いていました。しかし、結果は…期待外れでした。DeepSeek は精度を上げるのに時間がかかりましたが、ChatGPT はすぐにきれいなスクリプトを吐き出しました。ボールはリアルに跳ね返りませんでした。代わりに、ボックスの端でグリッチし、角に引っかかったり、壁を通り抜けたりしました。ChatGPTは深さよりもスピードを重視し、機能するソリューションを提供していますが、それは最も基本的な意味でのみです。


 import pygame import math # Initialize Pygame pygame.init() # Constants WIDTH, HEIGHT = 600, 600 FPS = 60 GRAVITY = 0.2 BOUNCE_DAMPING = 0.8 ROTATION_SPEED = 0.5 # Degrees per frame BALL_RADIUS = 10 # Colors YELLOW = (255, 255, 0) WHITE = (255, 255, 255) BLACK = (0, 0, 0) # Screen setup screen = pygame.display.set_mode((WIDTH, HEIGHT)) clock = pygame.time.Clock() # Square properties square_center = (WIDTH // 2, HEIGHT // 2) square_size = 300 angle = 0 # Ball properties ball_pos = [WIDTH // 2, HEIGHT // 2 - 50] ball_velocity = [2, 0] # Function to rotate a point around a center def rotate_point(point, center, angle): x, y = point cx, cy = center radians = math.radians(angle) cos_a, sin_a = math.cos(radians), math.sin(radians) new_x = cos_a * (x - cx) - sin_a * (y - cy) + cx new_y = sin_a * (x - cx) + cos_a * (y - cy) + cy return new_x, new_y # Main loop running = True while running: screen.fill(BLACK) for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Apply gravity ball_velocity[1] += GRAVITY # Move ball ball_pos[0] += ball_velocity[0] ball_pos[1] += ball_velocity[1] # Compute rotated square corners half_size = square_size // 2 square_corners = [ (-half_size, -half_size), (half_size, -half_size), (half_size, half_size), (-half_size, half_size) ] rotated_corners = [rotate_point((square_center[0] + x, square_center[1] + y), square_center, angle) for x, y in square_corners] # Check for collisions for i in range(4): p1, p2 = rotated_corners[i], rotated_corners[(i + 1) % 4] dx, dy = p2[0] - p1[0], p2[1] - p1[1] length = math.hypot(dx, dy) normal = (-dy / length, dx / length) # Perpendicular normal # Distance from ball to edge projection = (ball_pos[0] - p1[0]) * normal[0] + (ball_pos[1] - p1[1]) * normal[1] if projection < BALL_RADIUS: # Ball is colliding with edge # Reflect velocity dot = ball_velocity[0] * normal[0] + ball_velocity[1] * normal[1] ball_velocity[0] -= 2 * dot * normal[0] ball_velocity[1] -= 2 * dot * normal[1] # Apply bounce damping ball_velocity[0] *= BOUNCE_DAMPING ball_velocity[1] *= BOUNCE_DAMPING # Move ball out of collision ball_pos[0] += normal[0] * (BALL_RADIUS - projection) ball_pos[1] += normal[1] * (BALL_RADIUS - projection) # Rotate square angle += ROTATION_SPEED # Draw rotated square pygame.draw.polygon(screen, WHITE, rotated_corners, 2) # Draw ball, YELLOW, (int(ball_pos[0]), int(ball_pos[1])), BALL_RADIUS) # Update display pygame.display.flip() clock.tick(FPS) pygame.quit()


2. ディープシーク



 import pygame import math # Initialize Pygame pygame.init() # Constants WIDTH, HEIGHT = 600, 600 SQUARE_SIZE = 400 SQUARE_HALF = SQUARE_SIZE // 2 BALL_RADIUS = 10 GRAVITY = 0.5 RESTITUTION = 0.8 ANGULAR_VELOCITY = 1 # Degrees per frame # Setup display screen = pygame.display.set_mode((WIDTH, HEIGHT)) pygame.display.set_caption("Bouncing Ball in Rotating Square") clock = pygame.time.Clock() # Initialize variables square_center = (WIDTH//2, HEIGHT//2) angle = 0 ball_pos = [WIDTH//2, HEIGHT//2] ball_vel = [0, 0] def rotate_point(point, center, angle): """Rotate a point around a center by given angle (degrees)""" theta = math.radians(-angle) ox, oy = center px, py = point qx = ox + math.cos(theta) * (px - ox) - math.sin(theta) * (py - oy) qy = oy + math.sin(theta) * (px - ox) + math.cos(theta) * (py - oy) return qx, qy running = True while running: dt = clock.tick(60) / 1000 # Delta time in seconds # Event handling for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Update square rotation angle = (angle + ANGULAR_VELOCITY) % 360 # Apply physics ball_vel[1] += GRAVITY ball_pos[0] += ball_vel[0] * dt ball_pos[1] += ball_vel[1] * dt # Collision detection and response # Convert ball position to square's local coordinate system translated = (ball_pos[0] - square_center[0], ball_pos[1] - square_center[1]) rotated = rotate_point((translated[0], translated[1]), (0, 0), -angle) collision = False new_local_x, new_local_y = rotated[0], rotated[1] # Check boundaries in local coordinates if rotated[0] < -SQUARE_HALF + BALL_RADIUS: new_local_x = -SQUARE_HALF + BALL_RADIUS collision = True elif rotated[0] > SQUARE_HALF - BALL_RADIUS: new_local_x = SQUARE_HALF - BALL_RADIUS collision = True if rotated[1] < -SQUARE_HALF + BALL_RADIUS: new_local_y = -SQUARE_HALF + BALL_RADIUS collision = True elif rotated[1] > SQUARE_HALF - BALL_RADIUS: new_local_y = SQUARE_HALF - BALL_RADIUS collision = True if collision: # Convert corrected position back to global coordinates corrected = rotate_point((new_local_x, new_local_y), (0, 0), angle) ball_pos[0] = corrected[0] + square_center[0] ball_pos[1] = corrected[1] + square_center[1] # Calculate reflection in local coordinates local_vel = rotate_point(ball_vel, (0, 0), -angle) if new_local_x != rotated[0]: # X-axis collision local_vel = (-local_vel[0] * RESTITUTION, local_vel[1]) if new_local_y != rotated[1]: # Y-axis collision local_vel = (local_vel[0], -local_vel[1] * RESTITUTION) # Convert velocity back to global coordinates global_vel = rotate_point(local_vel, (0, 0), angle) ball_vel[0], ball_vel[1] = global_vel[0], global_vel[1] # Drawing screen.fill((0, 0, 0)) # Draw rotating square square = pygame.Surface((SQUARE_SIZE, SQUARE_SIZE), pygame.SRCALPHA) pygame.draw.rect(square, (255, 0, 0), (0, 0, SQUARE_SIZE, SQUARE_SIZE), 2) rotated_square = pygame.transform.rotate(square, angle) screen.blit(rotated_square, rotated_square.get_rect(center=square_center)) # Draw ball, (255, 255, 0), (int(ball_pos[0]), int(ball_pos[1])), BALL_RADIUS) pygame.display.flip() pygame.quit()


3. クウェンの成果:残念な試み

ChatGPT の出力が期待外れだったとしたら、 Qwen はまったく期待外れでした。Qwen は複雑なタスクの処理で高い評価を得ていたため、そのパフォーマンスには本当に大きな期待を抱いていました。しかし、回転ボールのシミュレーションのコードを実行したところ、結果は期待とはかけ離れていました。ChatGPT と同様に、Qwen は深く考える必要もなく、ほぼ瞬時にコードを生成しました。



import pygame import math # Initialize Pygame pygame.init() # Screen dimensions WIDTH, HEIGHT = 600, 600 screen = pygame.display.set_mode((WIDTH, HEIGHT)) pygame.display.set_caption("Bouncing Ball in Rotating Square") # Colors YELLOW = (255, 255, 0) WHITE = (255, 255, 255) BLACK = (0, 0, 0) # Clock for controlling frame rate clock = pygame.time.Clock() FPS = 60 # Box properties box_size = 300 box_center = (WIDTH // 2, HEIGHT // 2) angle = 0 # Initial rotation angle rotation_speed = 1 # Degrees per frame # Ball properties ball_radius = 10 ball_pos = [box_center[0], box_center[1] - box_size // 4] # Start near the top center of the box ball_velocity = [4, 0] # Initial velocity (x, y) gravity = 0.2 # Gravity effect # Function to rotate a point around another point def rotate_point(point, angle, origin): ox, oy = origin px, py = point qx = ox + math.cos(math.radians(angle)) * (px - ox) - math.sin(math.radians(angle)) * (py - oy) qy = oy + math.sin(math.radians(angle)) * (px - ox) + math.cos(math.radians(angle)) * (py - oy) return qx, qy # Main game loop running = True while running: screen.fill(BLACK) # Handle events for event in pygame.event.get(): if event.type == pygame.QUIT: running = False # Update ball physics ball_velocity[1] += gravity # Apply gravity ball_pos[0] += ball_velocity[0] ball_pos[1] += ball_velocity[1] # Rotate the box angle += rotation_speed if angle >= 360: angle -= 360 # Define the four corners of the square corners = [ (-box_size / 2, -box_size / 2), (box_size / 2, -box_size / 2), (box_size / 2, box_size / 2), (-box_size / 2, box_size / 2) ] # Rotate the corners around the center rotated_corners = [rotate_point(corner, angle, box_center) for corner in corners] # Check collision with the edges of the box collided = False for i in range(4): p1 = rotated_corners[i] p2 = rotated_corners[(i + 1) % 4] # Line segment between p1 and p2 x1, y1 = p1 x2, y2 = p2 # Closest point on the line to the ball dx = x2 - x1 dy = y2 - y1 t = max(0, min(1, ((ball_pos[0] - x1) * dx + (ball_pos[1] - y1) * dy) / (dx * dx + dy * dy))) closest_x = x1 + t * dx closest_y = y1 + t * dy # Distance between ball and closest point distance_sq = (closest_x - ball_pos[0]) ** 2 + (closest_y - ball_pos[1]) ** 2 if distance_sq <= ball_radius ** 2: # Collision detected collided = True # Normal vector of the edge edge_length = math.hypot(dx, dy) nx = -dy / edge_length ny = dx / edge_length # Reflect the velocity vector dot_product = ball_velocity[0] * nx + ball_velocity[1] * ny ball_velocity[0] -= 2 * dot_product * nx ball_velocity[1] -= 2 * dot_product * ny # Ensure the ball stays inside the box if not collided: # Clamp the ball position within the box ball_pos[0] = max(box_center[0] - box_size / 2 + ball_radius, min(ball_pos[0], box_center[0] + box_size / 2 - ball_radius)) ball_pos[1] = max(box_center[1] - box_size / 2 + ball_radius, min(ball_pos[1], box_center[1] + box_size / 2 - ball_radius)) # Draw the rotating square pygame.draw.polygon(screen, WHITE, rotated_corners, 2) # Draw the ball, YELLOW, (int(ball_pos[0]), int(ball_pos[1])), ball_radius) # Update the display pygame.display.flip() # Cap the frame rate clock.tick(FPS) # Quit Pygame pygame.quit()

2.古典的な追跡パズルに対する ChatGPT、Qwen、DeepSeek の応答の比較

現実世界の問題を解決する場合、すべての AI モデルが同じように作られているわけではありません。その能力をテストするために、私は典型的な追跡問題を提示しました。

「貴重な品物が盗まれました。持ち主は、泥棒がすでに 45 km 逃走した後、追跡を開始しました。160 km 移動した後、持ち主は泥棒が 18 km 先に残っていることを発見しました。泥棒を捕まえるには、あと何 km 移動する必要がありますか?」

1. ChatGPTの対応


2. DeepSeekの対応


2. クウェンの反応

Qwen は1 回目の試行で正解し、DeepSeek よりも速く回答しました。Qwen は、不要な手順を踏まずに簡潔で正確なソリューションを提供し、問題解決のスピードと精度の高さを示しました。


3つのAIは最終的に正解したが、 Qwenはスピードと効率性で際立っており、 DeepSeekは系統的なアプローチを披露した。ChatGPT複数回の試行が必要だった。

AI コンテンツの人間化: AI の人間的側面


プロンプト: Write a messy emotional love letter

興味深いことに、人間のような独創性をテストしたところ、ChatGPT、DeepSeek、Qwen の 3 つのモデルすべてが、AI が生成したパターンから抜け出すのに苦労しました。注: 3 つすべてが、同じロボットのようなセリフで応答を開始しました。 「どこから始めればいいのかさえわかりません」 いずれにしても、私は Chatgpt に大きな期待を寄せていましたが、Qwen が勝ちました。


DeepSeek *:研究批判的思考に最適なツール。精度と深さにおいて他を上回ります。*

Qwen *: 古典的な謎を 1 回目の試行で解くという点で DeepSeek に匹敵し、人間味のあるコンテンツで勝利し、強力なオールラウンダーとなりました。*

ChatGPT *: 謎を解くのに何度も試行する必要がありましたが、創造的なタスク人間のようなやり取りには依然として最適な選択肢です。*

最終判定: 誰がどの AI を使うべきか?

  • 研究者:DeepSeek
  • エンジニア: DeepSeek
  • ライター: ChatGPT または Qwen
  • 弁護士:Qwen withchatgpt
  • 教育者: ChatGPT
  • コンテンツクリエイター:Deepseek の Qwen と deep-thinking


