Pandas讀取Excel文件的六種方法

Pandas?是一個?Python?數據分析庫,可以用來讀取?Excel?文件,Pandas提供了多種讀取Excel文件的方法,本文將給大家分享一些官方推薦的6種方法,代碼示例講解得非常詳細,需要的朋友可以參考下

Pandas提供了多種讀取Excel文件的方法,以下是官方推薦的6種方法:文章源自四五設計網-http://www.wasochina.com/39861.html

1. 使用pd.read_excel()函數

這是最常用的方法,可以讀取Excel文件,并將其轉換為Pandas數據框。可以指定工作表名和列名的行號。文章源自四五設計網-http://www.wasochina.com/39861.html

1
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0)
  • 'data.xlsx'是要讀取的Excel文件的文件路徑。
  • sheet_name='Sheet1'表示要讀取的工作表名為’Sheet1’。如果省略該參數,默認讀取第一個工作表。
  • header=0表示將文件中的第0行作為列名。如果省略該參數,默認將文件中的一行作為列名。

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df。可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。文章源自四五設計網-http://www.wasochina.com/39861.html

文章源自四五設計網-http://www.wasochina.com/39861.html

2. 使用pd.ExcelFile()和parse()函數

先使用pd.ExcelFile()函數創建一個Excel文件對象,然后使用parse()函數讀取指定的工作表。文章源自四五設計網-http://www.wasochina.com/39861.html

1
2
xlsx = pd.ExcelFile('data.xlsx')
df = xlsx.parse('Sheet1', header=0)
  • pd.ExcelFile('data.xlsx')創建了一個Excel文件對象xlsx,它代表了整個Excel文件。
  • parse('Sheet1', header=0)函數用于從Excel文件對象xlsx中讀取指定的工作表。'Sheet1'表示要讀取的工作表名為’Sheet1’,header=0表示將文件中的第0行作為列名。

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df。可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。文章源自四五設計網-http://www.wasochina.com/39861.html

3. 使用pd.read_table()函數

可以讀取Excel中的數據表,并指定分隔符(如制表符或逗號)。文章源自四五設計網-http://www.wasochina.com/39861.html

1
df = pd.read_table('data.xlsx', sheet_name='Sheet1', delimiter='\t', header=0)
  • 'data.xlsx'是Excel文件的路徑。
  • sheet_name='Sheet1'表示要讀取的工作表名為’Sheet1’。
  • delimiter='\t'指定數據表中的分隔符為制表符(‘\t’)。
  • header=0表示將文件中的第0行作為列名。

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df。可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。文章源自四五設計網-http://www.wasochina.com/39861.html

4. 使用pd.read_csv()函數

可以讀取以逗號分隔的Excel文件,可以指定分隔符、工作表名和列名的行號。文章源自四五設計網-http://www.wasochina.com/39861.html

1
df = pd.read_csv('data.csv', sheet_name='Sheet1', delimiter=',', header=0)
  • 'data.xlsx'是Excel文件的路徑。
  • sheet_name='Sheet1'表示要讀取的工作表名為’Sheet1’。

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df。可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。文章源自四五設計網-http://www.wasochina.com/39861.html

5. 使用pd.read_html()函數

可以讀取Excel文件中的HTML表格,并將其轉換為Pandas數據框。

1
2
tables = pd.read_html('data.xlsx', sheet_name='Sheet1')
df = tables[0]

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df。可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。

6. 使用pd.DataFrame.from_records()函數

可以讀取Excel文件中的記錄,并將其轉換為Pandas數據框。

1
2
data = pd.ExcelFile('data.xlsx').parse('Sheet1').to_records()
df = pd.DataFrame.from_records(data)
  • 'data.xlsx'是Excel文件的路徑。
  • sheet_name='Sheet1'表示要讀取的工作表名為’Sheet1’。

讀取完Excel文件后,將其轉換為Pandas數據框,并將結果賦值給變量df

可以使用df.head()函數查看前幾行數據,或使用其他Pandas函數和方法進行數據處理和分析。

以上是官方推薦的6種讀取Excel文件的方法。根據具體的需求和Excel文件的格式,選擇適合的方法來讀取數據。

Pandas提供了讀取Excel文件的方法,可以使用read_excel()函數來實現。以下是讀取Excel文件的方法:

首先,需要確保已經安裝了Pandas庫。可以使用以下命令進行安裝:

1
pip install pandas

接下來,導入Pandas庫:

1
import pandas as pd

使用read_excel()函數來讀取Excel文件。該函數的基本語法如下:

1
df = pd.read_excel('文件路徑', sheet_name='工作表名', header=行號)
  • '文件路徑':Excel文件的路徑,可以是相對路徑或絕對路徑。
  • '工作表名':要讀取的工作表的名稱。如果未指定,默認讀取第一個工作表。
  • header:指定要用作列名的行號。通常,第一行是列名,所以使用0作為行號。如果Excel文件沒有行號作為列名,則可以設置為None。

以下是一個完整的示例:

1
2
3
4
5
6
7
import pandas as pd
# 讀取Excel文件
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0)
# 打印數據框前幾行
print(df.head())

以上代碼將會讀取名為"data.xlsx"的Excel文件中的"Sheet1"工作表,并將數據存儲在名為"df"的數據框中。然后,通過head()函數打印數據框的前幾行。

通過上述方法,您可以輕松地使用Pandas讀取Excel文件并進行數據分析和處理。

以上就是Pandas讀取Excel的六種方法的詳細內容

繼續閱讀
我的微信
微信掃一掃
weinxin
我的微信
惠生活福利社
微信掃一掃
weinxin
我的公眾號
 
  • 本文由 四五設計網小助手 發表于 2024年2月8日10:00:28
  • 轉載請務必保留本文鏈接:http://www.wasochina.com/39861.html

發表評論

匿名網友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

拖動滑塊以完成驗證