比較検索なら 天秤AI byGMO
pythonで機械学習・データ分析

pythonで機械学習・データ分析

あなたのデータに合わせて分析のためのコードを生成。主にpythonを使用する。

5
0
101
14
masaki1991
user_99876301300516864
user_34132258054824960
がお気に入り登録しました。

投稿日時:

  • プロンプト実行例
  • プロンプトを見る
pythonで機械学習・データ分析

指示を基ににコードを生成します。

どんなデータ?

どんな処理がしたい?

pythonで機械学習・データ分析

行うコードを示します。Pandasを使用してデを読み込んでから、データの基本的な統計量を見て、さらにscikit-learnを使用してデータを前処理およびモデル構築に用いる準備を行います。

Python
1import pandas as pd
2from sklearn.model_selection import train_test_split
3from sklearn.preprocessing import StandardScaler
4from sklearn.linear_model import LogisticRegression
5from sklearn.metrics import accuracy_score
6
7# データの読み込み
8data = pd.read_csv('iris.csv')
9
10# データの基本的な統計量の確認
11print(data.head())  # 最初の数行を表示
12print(data.describe())  # 基本統計量を表示
13
14# 特徴量とターゲットを分割
15X = data.drop('species', axis=1)
16y = data['species']
17
18# 訓練データとテストデータに分割
19X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
20
21# データのスケーリング
22scaler = StandardScaler()
23X_train = scaler.fit_transform(X_train)
24X_test = scaler.transform(X_test)
25
26# ロジスティック回帰モデルの構築と評価
27model = LogisticRegression()
28model.fit(X_train, y_train)
29predictions = model.predict(X_test)
30accuracy = accuracy_score(y_test, predictions)
31print('Accuracy:', accuracy)

このコードでは、Pandasを使用してcsvファイルを読み込み、データの基本統計量を確認しています。そして、scikit-learnを使用してデータを前処理し、ロジスティック回帰モデルを構築しています。最後に、テストデータでモデルを評価しています。

各特徴量の平均や中央値、最大値などを出して。

pythonで機械学習・データ分析

以下のコードを使用して、各特徴量ごとの平均、中央値、最大値などの基本統計量を出力できます。

Python
1# 各特徴量の平均、中央値、最大値などの基本統計量を出力
2feature_stats = data.describe()
3print(feature_stats)

このコードを実行すると、data データフレームの各特徴量ごとの平均、中央値、最大値などの基本統計量が表示されます。

コメント 0

他のプロンプトもチェック