吃西瓜大赛

时间:2018-05-16 12:08:48来源:杰瑞文章网点击:作文字数:600字
数据分析离不开数据库,如何使用python连接MySQL数据库,并进行增删改查操作呢? 我们还会遇到需要将大批量数据导入数据库的情况,又该如何使用Python进行大数据的高效导入呢? 本文会一一讲解,并配合代码和实例。 一、背景 我是在Anaconda notebook中进行连接实验的,环境Python3.6,当然也可以在Python Shell里面进行操作。 最常用也最稳定的用于连接MySQL数据库的python库是PyMySQL。 所以本文讨论的是利用PyMySQL连接MySQL数据库,进行增删改查操作,以及存储大批量数据。 方法参考PyMySQL官方文档和《python数据采集》关于数据存储的部分。 欢迎大家去阅读原文档,相信会理解的更加透彻。 二、基本操作 1、安装PyMySQL库 最简单的方式: 在命令行输入 pip install pymysql 或者: 下载whl文件进行安装,安装过程自行百度。 2、安装MySQL数据库 类MySQL数据库有两种:MySQL和MariaDB,我用的是后者MariaDB。 两者在绝大部分性能上是兼容的,使用起来感觉不到啥区别。 给出下载地址:MySQL,MariaDB,安装过程很简单,一路Next Step,不过要记好密码。 有个小插曲,MySQL和MariaDB相当于姐姐妹妹的关系,两者由同一个人(Widenius)创建的。MySQL被Oracle收购后,Widenius先生觉得不爽,于是搞了个MariaDB,可以完全替代MySQL。大牛就是任性。 3、SQL基本语法 下面要用SQL的表创建、查询、数据插入等功能,这里简要介绍一下SQL语言的基本语句。 查看数据库:SHOW DATABASES; 创建数据库:CREATE DATEBASE 数据库名称; 使用数据库:USE 数据库名称; 查看数据表:SHOW TABLES; 创建数据表:CREATE TABLE 表名称(列名1 (数据类型1),列名2 (数据类型2)); 插入数据:INSERT INTO 表名称(列名1,列名2) VALUES(数据1,数据2); 查看数据:SELECT * FROM 表名称; 更新数据:UPDATE 表名称 SET 列名1=新数据1,列名2=新数据2 WHERE 某列=某数据; 4、连接数据库 安装好必要得文件和库后,接下来正式开始连接数据库吧,虽然神秘却不难哦! #首先导入PyMySQL库 import pymysql #连接数据库,创建连接对象connection #连接对象作用是:连接数据库、发送数据库信息、处理回滚操作(查询中断时,数据库回到最初状态)、创建新的光标对象 connection = pymysql.connect(host = 'localhost' #host属性 user = 'root' #用户名 password = '******' #此处填登录数据库的密码 db = 'mysql' #数据库名 ) 执行这段代码就连接好了! 5、增删改查操作 首先来查看一下有哪些数据库: #创建光标对象,一个连接可以有很多光标,一个光标跟踪一种数据状态。 #光标对象作用是:、创建、删除、写入、查询等等 cur = connection.cursor() #查看有哪些数据库,通过cur.fetchall()获取查询所有结果 print(cur.fetchall()) 打印出所有数据库: (('information_schema',), ('law',), ('mysql',), ('performance_schema',), ('test',)) 在test数据库里创建表: #使用数据库test cur.execute('USE test') #在test数据库里创建表student,有name列和age列 cur.execute('CREATE TABLE student(name VARCHAR(20),age TINYINT(3))') 向数据表student中插入一条数据: sql = 'INSERT INTO student (name,age) VALUES (%s,%s)' cur.execute(sql,('XiaoMing',23)) 查看数据表student内容: cur.execute('SELECT * FROM student') print(cur.fetchone()) 打印输出为:('XiaoMing', 23) Bingo!是我们刚刚插入的一条数据 最后,要记得关闭光标和连接: #关闭连接对象,否则会导致连接泄漏,消耗数据库资源 connection.close() #关闭光标 cur.close() OK了,整个流程大致如此。 当然这里都是很基础的操作,更多的使用方法需要在PyMySQL官方文档里去寻找。 三、导入大数据文件 以csv文件为例,csv文件导入数据库一般有两种方法: 1、通过SQL的insert方法一条一条导入,适合数据量小的CSV文件,这里不做赘述。 2、通过load data方法导入,速度快,适合大数据文件,也是本文的重点。 样本CSV文件如下: 总体工作分为3步: 1、用python连接mysql数据库; 2、基于CSV文件表格字段创建表; 3、使用load data方法导入CSV文件内容。 sql的load data语法简介: LOAD DATA LOCAL INFILE 'csv_file_path' INTO TABLE table_name FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES csv_file_path 指文件绝对路径 table_name指表名称 FIELDS TERMINATED BY ','指以逗号分隔 LINES TERMINATED BY '\r\n'指换行 IGNORE 1 LINES指跳过第一行,因为第一行是表的字段名 下面给出全部代码: #导入pymysql方法 import pymysql #连接数据库 config = {'host':'', 'port':3306, 'user':'username', 'passwd':'password', 'charset':'utf8mb4', 'local_infile':1 } conn = pymysql.connect(**config) cur = conn.cursor() #load_csv函数,参数分别为csv文件路径,表名称,数据库名称 def load_csv(csv_file_path,table_name,database='evdata'): #打开csv文件 file = open(csv_file_path, 'r',encoding='utf-8') #读取csv文件第一行字段名,创建表 reader = file.readline() b = reader.split(',') colum = '' for a in b: colum = colum + a + ' varchar(255),' colum = colum[:-1] #编写sql,create_sql负责创建表,data_sql负责导入数据 create_sql = 'create table if not exists ' + table_name + ' ' + '(' + colum + ')' + ' DEFAULT CHARSET=utf8' data_sql = "LOAD DATA LOCAL INFILE '%s' INTO TABLE %s FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES" % (csv_filename,table_name) #使用数据库 cur.execute('use %s' % database) #设置编码格式 cur.execute('SET NAMES utf8;') cur.execute('SET character_set_connection=utf8;') #执行create_sql,创建表 cur.execute(create_sql) #执行data_sql,导入数据 cur.execute(data_sql) conn.commit() #关闭连接 conn.close() cur.close()
作文投稿

吃西瓜大赛一文由杰瑞文章网免费提供,本站为公益性作文网站,此作文为网上收集或网友提供,版权归原作者所有,如果侵犯了您的权益,请及时与我们联系,我们会立即删除!

杰瑞文章网友情提示:请不要直接抄作文用来交作业。你可以学习、借鉴、期待你写出更好的作文。

说说你对这篇作文的看法吧