内容へ移動
fl8 Wiki
ユーザ用ツール
ログイン
サイト用ツール
検索
ツール
文書の表示
以前のリビジョン
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
現在位置:
Dokuwiki.fl8.jp
»
50 日記
»
2023
»
08
»
2023.08.11 Pandasで重複行削除
トレース:
50_dialy:2023:08:11
この文書は読取専用です。文書のソースを閲覧することは可能ですが、変更はできません。もし変更したい場合は管理者に連絡してください。
====== 2023.08.11 Pandasで重複行削除 ====== <code> import pandas as pd # データフレームの生成 df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': [1, 2, 3, 4, 3, 2, 1, 4]}) print("Original DataFrame:") print(df) # 重複行の削除 df_no_duplicates = df.drop_duplicates() print("\nDataFrame after removing duplicates:") print(df_no_duplicates) </code> この場合結果はこうなる <code> Original DataFrame: A B C 0 foo one 1 1 bar one 2 2 foo two 3 3 bar three 4 4 foo two 3 5 bar two 2 6 foo one 1 7 bar three 4 DataFrame after removing duplicates: A B C 0 foo one 1 1 bar one 2 2 foo two 3 3 bar three 4 5 bar two 2 </code> ===== 例えば"A"列のみを考慮して重複行を削除したい場合 ===== <code> df_no_duplicates_A = df.drop_duplicates(subset=['A']) print("\nDataFrame after removing duplicates in column 'A':") print(df_no_duplicates_A) </code> この場合結果はこうなる <code> Original DataFrame: A B C 0 foo one 1 1 bar one 2 2 foo two 3 3 bar three 4 4 foo two 3 5 bar two 2 6 foo one 1 7 bar three 4 DataFrame after removing duplicates in column 'A': A B C 0 foo one 1 1 bar one 2 </code> ===== データフレームから直接重複削除 ===== もし元のデータフレームから直接重複を削除したい場合は、drop_duplicates()メソッドで inplace=True を指定します。 <code> df.drop_duplicates(inplace=True) </code> {{tag>日記 Pandas Python}}
50_dialy/2023/08/11.txt
· 最終更新: 2023/08/11 23:52 by
matsui
ページ用ツール
文書の表示
以前のリビジョン
バックリンク
文書の先頭へ