当前位置:Gxlcms > 
数据库问题 > 
pandas 连接数据库直接查表建立dataframe。loc,sort_values数据清洗操作
                     
                    
                        pandas 连接数据库直接查表建立dataframe。loc,sort_values数据清洗操作
                        
                            时间:2021-07-01 10:21:17
                            帮助过:37人阅读
							                        
                     
                    
                    
                    导入pandas
import pandas as pd
import numpy as np
#导入SqlAlchemy
from sqlalchemy 
import create_engine
if __name__ == 
"__main__":
    #建立数据库引擎
    engine = create_engine(
‘mysql+pymysql://root:mysql@localhost:3306/mymac‘)
    #写一条sql
    sql = 
‘select id,name,age,gender from student‘
    #建立dataframe
    df =
 pd.read_sql_query(sql,engine)
    # print(df)
    #按照年龄倒序    正序:ascending=True
    #翻译为sql  select * from student order by asc | desc
    # df = df.sort_values([‘age‘,‘gender‘],ascending=False)
    # print(df)
    #取年龄最小的学生  在尾部取值
    #翻译为sql select * from student order by age limit 1
    # df = df.sort_values([‘age‘]).tail(1)
    # print(df)
    
    #求整个班的平均年龄 
    avg_age=
 df.age.mean()
    #使用loc方法指定字段
    print(df.loc[(df[
‘age‘]<avg_age ) & df[
‘gender‘]==1
])
    #获取指定字段
    # print(df.loc[df[‘gender‘]==1,[‘id‘,‘name‘]])
                                      
    #将dataframe写入数据表,表名,数据引擎,索引是否入库
    # df.to_sql(‘student_copy‘,engine,index=False)
    
    #前提要安装好 openpyxl   安装命令 pip install openpyxl
    #导入成excel文件
    # df.to_excel(‘student.xlsx‘)
    # print(Student.objects.all())
 
pandas 连接数据库直接查表建立dataframe。loc,sort_values数据清洗操作
标签:建立   taf   openpyxl   __name__   span   xlsx   amp   pen   索引