百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python中的数据导入与查询(python怎样导入数据库)

off999 2025-07-24 21:09 35 浏览 0 评论

适用场景

  • 快速导入文本/Excel数据 → Pandas
  • 读取大型数值数据 → Numpy
  • 处理复杂二进制文件 → h5py/scipy.io
  • 数据库交互 → SQLAlchemy + Pandas

一、数据导入

1. 通用基础

  • 库声明
  • import numpy as np
    import pandas as pd

2. 文本文件

  • 原生读写
  • file = open('huck_finn.txt', 'r')
    text = file.read() # 读取全部内容
    file.close() # 关闭文件
    print(file.closed) # 检查是否关闭
  • 上下文管理器(推荐)
  • with open('huck_finn.txt', 'r') as file:
    print(file.readline()) # 逐行读取
  • Numpy 导入
    • 单数据类型:
    • data = np.loadtxt('mnist.txt', delimiter=',', skiprows=2, usecols=[0,2], dtype=str)
    • 多数据类型:
    • data = np.genfromtxt('titanic.csv', delimiter=',', names=True, dtype=None)
      data = np.recfromcsv('titanic.csv') # 等效简写
  • Pandas 导入
  • data = pd.read_csv(
    'winequality-red.csv',
    nrows=5, # 读取前5行
    header=None, # 无列名
    sep='\t', # Tab分隔
    comment='#', # 注释标识符
    na_values=[""] # 定义缺失值
    )

3. Excel文件

file = 'urbanpop.xlsx'  
data = pd.ExcelFile(file)  
df_sheet2 = data.parse('1960-1966', skiprows=[0], names=['Country', 'AAM: War(2002)'])  
sheet_names = data.sheet_names  # 获取所有sheet名称

4. 统计软件文件

  • SAS:
  • from sas7bdat import SAS7BDAT
    with SAS7BDAT('urbanpop.sas7bdat') as file:
    df_sas = file.to_data_frame()
  • Stata:
  • data = pd.read_stata('urbanpop.dta')

5. 关系型数据库

  • 连接与查询:
  • from sqlalchemy import create_engine
    engine = create_engine('sqlite:///Northwind.sqlite')
    table_names = engine.table_names() # 获取所有表名
    # 手动查询
    with engine.connect() as con:
    rs = con.execute("SELECT OrderID FROM Orders")
    df = pd.DataFrame(rs.fetchmany(size=5))
    df.columns = rs.keys()

    # Pandas直接查询
    df = pd.read_sql_query("SELECT * FROM Orders", engine)

6. 二进制文件

  • Pickle:
  • import pickle
    with open('pickled_fruit.pkl', 'rb') as file:
    pickled_data = pickle.load(file)
  • HDF5:
  • import h5py
    data = h5py.File('filename.hdf5', 'r')
    # 结构查看
    print(data.keys())
    print(data['meta']['Description'].value) # 提取元数据
  • Matlab:
  • import scipy.io
    mat = scipy.io.loadmat('workspace.mat')

二、数据探索

1. Numpy数组

data_array.dtype    # 数据类型  
data_array.shape    # 维度 (行, 列)  
len(data_array)     # 数组长度

2. Pandas DataFrame

df.head()        # 前5行  
df.tail(3)       # 后3行  
df.index         # 查看索引  
df.columns       # 查看列名  
df.info()        # 各列详细信息 (数据类型、非空值数量)  
data_array = df.values  # 转为Numpy数组

三、文件系统操作

魔法命令(Jupyter)

%pwd      # 当前路径  
%ls       # 列出目录内容  
%cd ..    # 切换到上级目录

os模块

import os  
os.getcwd()         # 当前工作目录  
os.listdir()        # 目录内容列表  
os.chdir('/path')   # 切换路径  
os.rename('old.txt', 'new.txt')  # 重命名  
os.mkdir('newdir')  # 创建目录  
os.remove('file.txt')  # 删除文件  

四、关键注意事项

  1. 上下文管理器:优先使用 with open(...) 管理资源,避免手动关闭文件。
  2. 大文件读取:使用 nrowschunksize 分块读取,减少内存消耗。
  3. 缺失值处理:定义 na_values 参数以正确识别缺失值。
  4. 结构化数据:
  5. Numpy的 genfromtxt 适合混合数据类型。
  6. Pandas的 read_csv 更适合表格数据(自动处理列名、索引)。

相关推荐

兄弟打印机怎么连接wifi(兄弟打印机怎么连接wifi手机打印)
  • 兄弟打印机怎么连接wifi(兄弟打印机怎么连接wifi手机打印)
  • 兄弟打印机怎么连接wifi(兄弟打印机怎么连接wifi手机打印)
  • 兄弟打印机怎么连接wifi(兄弟打印机怎么连接wifi手机打印)
  • 兄弟打印机怎么连接wifi(兄弟打印机怎么连接wifi手机打印)
uefi模式下找不到硬盘(uefi引导找不到硬盘)

首先你的安装盘必须是从UEFI启动的,然后它才能安装为UEFI启动。(条件:Fat32文件系统,efi文件夹)其次你MBR+BIOS的系统想换成GPT+EFI的,分区得做一点改动,腾出来100M的空...

win7怎么安装蓝牙驱动程序(win7电脑安装蓝牙驱动教程)

方法如下:  1、再开始里点击控制版面,点击【硬件和声音】找到【添加设备】  2、之后再选择你要添加的蓝牙耳机。  3、系统就会提示正在与蓝牙适配器连接,然后提示添加成功。  4、点击“开始”-“...

怎么装系统win7旗舰版(电脑怎么装win7旗舰版)

1、目前支持64位的Wincc版本有:WinccV7Sp3、WinccV11Sp2、WinccV12。2、Wincc的V11与V12两个版本不能共存,即不能同时安装在同一台电脑上。上述这两...

u盘恢复工具免费版(u盘文件恢复工具免费版)
  • u盘恢复工具免费版(u盘文件恢复工具免费版)
  • u盘恢复工具免费版(u盘文件恢复工具免费版)
  • u盘恢复工具免费版(u盘文件恢复工具免费版)
  • u盘恢复工具免费版(u盘文件恢复工具免费版)
qq特别关心查询入口电脑版(电脑版qq特别关心网站登录)
  • qq特别关心查询入口电脑版(电脑版qq特别关心网站登录)
  • qq特别关心查询入口电脑版(电脑版qq特别关心网站登录)
  • qq特别关心查询入口电脑版(电脑版qq特别关心网站登录)
  • qq特别关心查询入口电脑版(电脑版qq特别关心网站登录)
怎样恢复桌面图标原样(怎样恢复桌面图标原样显示)

桌面图标恢复原样步骤方法如下:1.右键点击图标、并点击‘属性’两字,再点击‘打开文件位置‘2.然后找到文件所在的位置,然后暂时将文件在一旁放着3.然后再去点击‘更换图标’这四个字,找到刚刚打开的文件...

消除u盘写保护(怎么解除u盘写保护)

如果您的U盘启用了写保护功能,可以尝试以下几种方法来解除写保护:1.检查U盘上的物理写保护开关:部分U盘有一个物理的写保护开关,可以在U盘的外壳上找到。请确保开关处于非写保护状态。2.使用CMD命...

microsoft国际版(微软国际版bing)

win10系统自带的edge浏览器不分国内版和国际版。搜索引擎Bing分为国内版和国际版,区别如下一、迎合不同人群的需求。国际版显得更加个性,他迎合了不同人群的需求,在收缩上更加方便化和智能化,后期可...

为什么格式化sd卡后不能用了

SD卡受损后不格式化直接修复的方法:1,当系统发现SD卡受损之后,会提示进行格式化。2,把SD卡插入读卡器,接到电脑USB后,电脑提示格式化,点取消。然后查看一下属性。直接使用属性中的工具-开始检查...

c盘删除的东西能恢复吗(c盘删掉的东西还在吗)

    1.重新安装。  如果是安装在c盘下的普通应用程序,重新下载安装即可;  2.备份恢复或重装系统。  如果是删除了系统文件,在系统备过份且知道删除...

电脑如何重装系统winxp(电脑如何重装xp系统教程)

重装XP系统的步骤如下:1.首先备份您的重要文件和数据。2.插入XP系统安装光盘,重新启动计算机。3.在启动时按下计算机制造商指定的键(通常是F2、F12、Esc等)进入BIOS设置或启动菜单。...

win8密钥永久激活工具(win8密钥永久激活工具在哪)

win8.1正式版升级win10,自动激活,win8.1的密钥不能激活win10,升级win10正式版以后,无论怎么安装win10,系统都是自动激活状态。终极PID检测产品密钥:GCRJD...

制作系统安装u盘教程(制作系统安装盘及系统安装的步骤)

答u盘做系统详细步骤如下:  1.首先我们要准备一个10G内存的空白u盘,然后在装机吧官网下载一个装机吧一键重装系统软件,安装完成后打开软件,制作模式选择”USB-HDD“分区格式为”NTFS“点击...

联想win7怎么进入bios设置(联想win7进入bios设置win10)
联想win7怎么进入bios设置(联想win7进入bios设置win10)

联想电脑win7进入bios设置的具体步骤如下: 1、首先我们打开电脑的同时,按下键盘上的“F2”。2、然后我们在弹出来的窗口中就可以进入到BIOS界面中。3、然后我们按下键盘上的“F10”,之后回车确定即可退出。联想电脑win7...

2025-11-09 14:03 off999

取消回复欢迎 发表评论: