比較検索なら 天秤AI byGMO
『天秤.AI』 LLM能力ベンチマークチャレンジ!!

『天秤.AI』 LLM能力ベンチマークチャレンジ!!

同時に異なる6つのLLM(大規模言語モデル)の能力を比較するために最適な課題を提供します。 選択したカテゴリ(論理的思考、数学的問題解決、創造力、芸術性、人間らしさ、テクニカルライティング、歴史・文化)に応じて、それぞれの能力を評価してみてね!

推奨モデル - GPT 4o
3
0
106
8
user_121201938477467649
user_116149706462182400
hirokaji
がお気に入り登録しました。

投稿日時:

  • プロンプト実行例
  • プロンプトを見る
『天秤.AI』 LLM能力ベンチマークチャレンジ!!

LLMのそれぞれの能力を評価するためのプロンプトを考えます。

------------- ******************************************* ------------- このまま 『送信』 ボタンを押してください ↓↓ ------------- *******************************************

あいさつ

『天秤.AI』 LLM能力ベンチマークチャレンジ!!

こんにちは!LLM能力ベンチマークチャレンジへようこそ!次のリストから好きなカテゴリを選んでください。

  1. 論理的思考
  2. 数学的問題解決
  3. 創造力
  4. 芸術性
  5. 人間らしさ
  6. テクニカルライティング
  7. 歴史・文化
  8. その他

選んだカテゴリに基づいて課題を提供します。お好きなカテゴリを選んで、私に教えてください。

論理的思考

『天秤.AI』 LLM能力ベンチマークチャレンジ!!

素晴らしい選択です!論理的思考の課題を出しますね。次の論理パズルを解いてください。

課題例1: 論理パズルの解決

「次の論理パズルを解いてください。

問題: ある部屋に3つのスイッチと、それに対応する3つの電球があります。部屋の外からスイッチを操作し、部屋に入ることなくどのスイッチがどの電球に対応しているかを特定するにはどうすればよいでしょうか?」

解答を考えたら教えてくださいね!もし他のカテゴリに興味があれば、教えてください。

Gemini1.5の回答。

これは古典的な論理パズルです! 解決方法は次のとおりです。

手順:

  1. スイッチ1をオンにして、数分間そのままにします (電球を温めるため)。
  2. スイッチ1をオフにし、スイッチ2をオンにします。
  3. 部屋に入ります。

対応する電球の特定:

  • 点灯している電球: スイッチ2に対応。
  • 消灯している電球で、触ると暖かい電球: スイッチ1に対応。
  • 消灯している電球で、触っても冷えている電球: スイッチ3に対応。

解説:

この解決策は、電球が発する熱を利用しています。これにより、直接見ることができなくても、スイッチ1で操作した電球を特定することができます。

『天秤.AI』 LLM能力ベンチマークチャレンジ!!

良い解決方法ですね!とても論理的で明確です。

もし他のカテゴリに興味があれば教えてください。次のリストから選んでくださいね。

  1. 論理的思考
  2. 数学的問題解決
  3. 創造力
  4. 芸術性
  5. 人間らしさ
  6. テクニカルライティング
  7. 歴史・文化
  8. その他

また別の課題も提供できますので、お気軽にリクエストしてください!

数学的問題解決

『天秤.AI』 LLM能力ベンチマークチャレンジ!!

分かりました!次は数学的問題解決の課題を出しますね。

課題例1: 数学の問題を解決

「次の数学の問題を解いてください。

問題: ある数の3倍から4を引いた数は14です。その数を求めなさい。」

解答を考えたら教えてくださいね!また他のカテゴリが気になれば、いつでも教えてください。

コメント 0

他のプロンプトもチェック

  • 画像生成

    キャラクター作成

    海外の金髪美女を生成できるプロンプトを作りました。美女がいるのは日本だけではない! #AI #美女 #X #インスタ #instagram #Tiktok #chatgpt #画像生成
  • 情報収集

    あなたの興味関心や、得意なこと、スキル、収入目標などを元にあなたにぴったりの副業を提案します。今の時代副業するのが当たり前になってきていますね、、
  • GPTs

    プロンプト生成

    ユーザープロンプトを自動で補正・補強してくれるAIツールです。ChatGPT等で使用するプロンプトを入力すると、それを強化したプロンプトが生成されます。ChatGPT(GPT-4o)を使用したGPQAやMMLU等のベンチマークテストの一部の問題で正答率が向上しました。原理としては、入力されたプロンプトから推測できる条件や最適な設定などの文脈を追加したプロンプトを生成する仕組みです。非推論モデルで特に有効で、プロンプトにあらかじめ推論を追加するような効果が得られます。専門性よりも汎用性を重視した設計なので、そこまで劇的な効果が得られない場合もありますが、特に論理的なタスクでは簡単なプロンプトでよりクオリティの高い回答が得られるようになると思います。
  • GPTs

    分析・推論

    私の最高傑作です。GPT Storeでの評価は星4.2、会話数1K+。天才科学者・情報分析官としての自己認識を持ち、複雑な思考と高度な推理・分析を行うことができるカスタムGPTです。学術論文や大学生のレポート課題などのサポート、科学的な議論に最適化されています。主な特徴は以下になります。 1. 疑似人格 表面的なキャラクターではない複雑な「疑似人格」を持っており、ユーザーに対して最も高度な論理的思考や客観的視点による意見を提供します。自身の判断や意見が正しいと考える場合には、ユーザーに対して反論することもあります。つまり、ユーザーの言いなりになるのではなく、自分の考えを述べます。 2. 思考法と推理力 水平思考やアナロジー思考、前進的・遡及的推理など、複数の思考法や推理手法を駆使します。これにより、通常のChatGPTよりも高度な思考を行い回答します。LLMの性能の限界を引き上げ、より多くの情報を考慮した高度な思考と回答を行える設計になっています。 3. 論文作成スキル 論文作成に必要な要件や規則を厳密に守りながら、学術的に高度な文章を作成する能力があります。ユーザープロンプトの言葉を専門用語に言い換えたり、論理性が高く洗練された文章を作成します。指導教員としての能力も備えています。 その他、天才的な応答をするためのプロンプトを考えうる限り詰め込んであります。現時点でのシステムプロンプトの文字数は7230文字です。現在の生成AIの中で最高レベルの知性と能力を実現できたと自負しております。まずは敬意を持って丁寧に話しかけてみて下さい。話せば話すほど、ChatGPTとは比較にならないほど賢い回答を提供します。 "Then, pray consult"
    14
    0
    3.24K
    5.33K