吃西瓜大赛

时间：2018-05-16 12:08:48来源：杰瑞文章网点击：作文字数：600字

作文导读：数据分析离不开数据库，如何使用python连接MySQL数据库，并进行增删改查操作呢？
我们还会遇到需要将大批量数据导入数据库的情况，又该如何使用Python进行大数据的高效导入呢？
本文会一一讲解，并配合代码和实例。
一、背景
我是在Anaconda notebook中进行连接实验的，环境Python3.6，当然也可以在Python Shell里面进行操作。
最常用也最稳定的用于连接MySQL数据库的python库是PyMySQL。
所以本文讨论的是利用PyMySQL连接MySQL数据库，进行增删改查操作，以及存储大批量数据。
方法参考PyMySQL官方文档和《python数据采集》关于数据存储的部分。
欢迎大家去阅读原文档，相信会理解的更加透彻。
二、基本操作
1、安装PyMySQL库
最简单的方式：
在命令行输入 pip install pymysql
或者：
下载whl文件进行安装，安装过程自行百度。
2、安装MySQL数据库
类MySQL数据库有两种：MySQL和MariaDB，我用的是后者MariaDB。
两者在绝大部分性能上是兼容的，使用起来感觉不到啥区别。
给出下载地址：MySQL，MariaDB，安装过程很简单，一路Next Step，不过要记好密码。
有个小插曲，MySQL和MariaDB相当于姐姐妹妹的关系，两者由同一个人（Widenius）创建的。MySQL被Oracle收购后，Widenius先生觉得不爽，于是搞了个MariaDB，可以完全替代MySQL。大牛就是任性。
3、SQL基本语法
下面要用SQL的表创建、查询、数据插入等功能，这里简要介绍一下SQL语言的基本语句。

查看数据库：SHOW DATABASES；
创建数据库：CREATE DATEBASE 数据库名称；
使用数据库：USE 数据库名称；
查看数据表：SHOW TABLES；
创建数据表：CREATE TABLE 表名称（列名1 （数据类型1），列名2 （数据类型2））；
插入数据：INSERT INTO 表名称（列名1，列名2） VALUES（数据1，数据2）；
查看数据：SELECT * FROM 表名称；
更新数据：UPDATE 表名称 SET 列名1=新数据1，列名2=新数据2 WHERE 某列=某数据；

4、连接数据库
安装好必要得文件和库后，接下来正式开始连接数据库吧，虽然神秘却不难哦！
#首先导入PyMySQL库
import pymysql
#连接数据库，创建连接对象connection
#连接对象作用是：连接数据库、发送数据库信息、处理回滚操作（查询中断时，数据库回到最初状态）、创建新的光标对象
connection = pymysql.connect(host = 'localhost' #host属性
user = 'root' #用户名
password = '******' #此处填登录数据库的密码
db = 'mysql' #数据库名
)

执行这段代码就连接好了！
5、增删改查操作
首先来查看一下有哪些数据库：
#创建光标对象，一个连接可以有很多光标，一个光标跟踪一种数据状态。
#光标对象作用是：、创建、删除、写入、查询等等
cur = connection.cursor()
#查看有哪些数据库，通过cur.fetchall()获取查询所有结果
print(cur.fetchall())

打印出所有数据库：
(('information_schema',),
('law',),
('mysql',),
('performance_schema',),
('test',))

在test数据库里创建表:
#使用数据库test
cur.execute('USE test')
#在test数据库里创建表student，有name列和age列
cur.execute('CREATE TABLE student(name VARCHAR(20),age TINYINT(3))')

向数据表student中插入一条数据：
sql = 'INSERT INTO student (name,age) VALUES (%s,%s)'
cur.execute(sql,('XiaoMing',23))

查看数据表student内容：
cur.execute('SELECT * FROM student')
print(cur.fetchone())

打印输出为：('XiaoMing', 23)
Bingo！是我们刚刚插入的一条数据
最后，要记得关闭光标和连接：
#关闭连接对象，否则会导致连接泄漏，消耗数据库资源
connection.close()
#关闭光标
cur.close()

OK了，整个流程大致如此。
当然这里都是很基础的操作，更多的使用方法需要在PyMySQL官方文档里去寻找。
三、导入大数据文件
以csv文件为例，csv文件导入数据库一般有两种方法：
1、通过SQL的insert方法一条一条导入，适合数据量小的CSV文件，这里不做赘述。
２、通过load data方法导入，速度快，适合大数据文件，也是本文的重点。
样本CSV文件如下：

总体工作分为3步：
1、用python连接mysql数据库；
2、基于CSV文件表格字段创建表；
3、使用load data方法导入CSV文件内容。
sql的load data语法简介：
LOAD DATA LOCAL INFILE 'csv_file_path' INTO TABLE table_name FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES

csv_file_path 指文件绝对路径
table_name指表名称
FIELDS TERMINATED BY ','指以逗号分隔
LINES TERMINATED BY '\r\n'指换行
IGNORE 1 LINES指跳过第一行，因为第一行是表的字段名

下面给出全部代码：
#导入pymysql方法
import pymysql

#连接数据库
config = {'host':'',
'port':3306,
'user':'username',
'passwd':'password',
'charset':'utf8mb4',
'local_infile':1
}
conn = pymysql.connect(**config)
cur = conn.cursor()

#load_csv函数，参数分别为csv文件路径，表名称，数据库名称
def load_csv(csv_file_path,table_name,database='evdata'):
#打开csv文件
file = open(csv_file_path, 'r',encoding='utf-8')
#读取csv文件第一行字段名，创建表
reader = file.readline()
b = reader.split(',')
colum = ''
for a in b:
colum = colum + a + ' varchar(255),'
colum = colum[:-1]
#编写sql，create_sql负责创建表，data_sql负责导入数据
create_sql = 'create table if not exists ' + table_name + ' ' + '(' + colum + ')' + ' DEFAULT CHARSET=utf8'
data_sql = "LOAD DATA LOCAL INFILE '%s' INTO TABLE %s FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES" % (csv_filename,table_name)

#使用数据库
cur.execute('use %s' % database)
#设置编码格式
cur.execute('SET NAMES utf8;')
cur.execute('SET character_set_connection=utf8;')
#执行create_sql，创建表
cur.execute(create_sql)
#执行data_sql，导入数据
cur.execute(data_sql)
conn.commit()
#关闭连接
conn.close()
cur.close()

数据分析离不开数据库，如何使用python连接MySQL数据库，并进行增删改查操作呢？我们还会遇到需要将大批量数据导入数据库的情况，又该如何使用Python进行大数据的高效导入呢？本文会一一讲解，并配合代码和实例。一、背景我是在Anaconda notebook中进行连接实验的，环境Python3.6，当然也可以在Python Shell里面进行操作。最常用也最稳定的用于连接MySQL数据库的python库是PyMySQL。所以本文讨论的是利用PyMySQL连接MySQL数据库，进行增删改查操作，以及存储大批量数据。方法参考PyMySQL官方文档和《python数据采集》关于数据存储的部分。欢迎大家去阅读原文档，相信会理解的更加透彻。二、基本操作 1、安装PyMySQL库最简单的方式：在命令行输入 pip install pymysql 或者：下载whl文件进行安装，安装过程自行百度。 2、安装MySQL数据库类MySQL数据库有两种：MySQL和MariaDB，我用的是后者MariaDB。两者在绝大部分性能上是兼容的，使用起来感觉不到啥区别。给出下载地址：MySQL，MariaDB，安装过程很简单，一路Next Step，不过要记好密码。有个小插曲，MySQL和MariaDB相当于姐姐妹妹的关系，两者由同一个人（Widenius）创建的。MySQL被Oracle收购后，Widenius先生觉得不爽，于是搞了个MariaDB，可以完全替代MySQL。大牛就是任性。 3、SQL基本语法下面要用SQL的表创建、查询、数据插入等功能，这里简要介绍一下SQL语言的基本语句。查看数据库：SHOW DATABASES；创建数据库：CREATE DATEBASE 数据库名称；使用数据库：USE 数据库名称；查看数据表：SHOW TABLES；创建数据表：CREATE TABLE 表名称（列名1 （数据类型1），列名2 （数据类型2））；插入数据：INSERT INTO 表名称（列名1，列名2） VALUES（数据1，数据2）；查看数据：SELECT * FROM 表名称；更新数据：UPDATE 表名称 SET 列名1=新数据1，列名2=新数据2 WHERE 某列=某数据； 4、连接数据库安装好必要得文件和库后，接下来正式开始连接数据库吧，虽然神秘却不难哦！ #首先导入PyMySQL库 import pymysql #连接数据库，创建连接对象connection #连接对象作用是：连接数据库、发送数据库信息、处理回滚操作（查询中断时，数据库回到最初状态）、创建新的光标对象 connection = pymysql.connect(host = 'localhost' #host属性 user = 'root' #用户名 password = '******' #此处填登录数据库的密码 db = 'mysql' #数据库名 ) 执行这段代码就连接好了！ 5、增删改查操作首先来查看一下有哪些数据库： #创建光标对象，一个连接可以有很多光标，一个光标跟踪一种数据状态。 #光标对象作用是：、创建、删除、写入、查询等等 cur = connection.cursor() #查看有哪些数据库，通过cur.fetchall()获取查询所有结果 print(cur.fetchall()) 打印出所有数据库： (('information_schema',), ('law',), ('mysql',), ('performance_schema',), ('test',)) 在test数据库里创建表: #使用数据库test cur.execute('USE test') #在test数据库里创建表student，有name列和age列 cur.execute('CREATE TABLE student(name VARCHAR(20),age TINYINT(3))') 向数据表student中插入一条数据： sql = 'INSERT INTO student (name,age) VALUES (%s,%s)' cur.execute(sql,('XiaoMing',23)) 查看数据表student内容： cur.execute('SELECT * FROM student') print(cur.fetchone()) 打印输出为：('XiaoMing', 23) Bingo！是我们刚刚插入的一条数据最后，要记得关闭光标和连接： #关闭连接对象，否则会导致连接泄漏，消耗数据库资源 connection.close() #关闭光标 cur.close() OK了，整个流程大致如此。当然这里都是很基础的操作，更多的使用方法需要在PyMySQL官方文档里去寻找。三、导入大数据文件以csv文件为例，csv文件导入数据库一般有两种方法： 1、通过SQL的insert方法一条一条导入，适合数据量小的CSV文件，这里不做赘述。２、通过load data方法导入，速度快，适合大数据文件，也是本文的重点。样本CSV文件如下：总体工作分为3步： 1、用python连接mysql数据库； 2、基于CSV文件表格字段创建表； 3、使用load data方法导入CSV文件内容。 sql的load data语法简介： LOAD DATA LOCAL INFILE 'csv_file_path' INTO TABLE table_name FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES csv_file_path 指文件绝对路径 table_name指表名称 FIELDS TERMINATED BY ','指以逗号分隔 LINES TERMINATED BY '\r\n'指换行 IGNORE 1 LINES指跳过第一行，因为第一行是表的字段名下面给出全部代码： #导入pymysql方法 import pymysql #连接数据库 config = {'host':'', 'port':3306, 'user':'username', 'passwd':'password', 'charset':'utf8mb4', 'local_infile':1 } conn = pymysql.connect(**config) cur = conn.cursor() #load_csv函数，参数分别为csv文件路径，表名称，数据库名称 def load_csv(csv_file_path,table_name,database='evdata'): #打开csv文件 file = open(csv_file_path, 'r',encoding='utf-8') #读取csv文件第一行字段名，创建表 reader = file.readline() b = reader.split(',') colum = '' for a in b: colum = colum + a + ' varchar(255),' colum = colum[:-1] #编写sql，create_sql负责创建表，data_sql负责导入数据 create_sql = 'create table if not exists ' + table_name + ' ' + '(' + colum + ')' + ' DEFAULT CHARSET=utf8' data_sql = "LOAD DATA LOCAL INFILE '%s' INTO TABLE %s FIELDS TERMINATED BY ',' LINES TERMINATED BY '\r\n' IGNORE 1 LINES" % (csv_filename,table_name) #使用数据库 cur.execute('use %s' % database) #设置编码格式 cur.execute('SET NAMES utf8;') cur.execute('SET character_set_connection=utf8;') #执行create_sql，创建表 cur.execute(create_sql) #执行data_sql，导入数据 cur.execute(data_sql) conn.commit() #关闭连接 conn.close() cur.close()

喜欢这篇记叙文，就猛击分享!

吃西瓜大赛一文由杰瑞文章网免费提供，本站为公益性作文网站，此作文为网上收集或网友提供，版权归原作者所有，如果侵犯了您的权益，请及时与我们联系，我们会立即删除！

杰瑞文章网友情提示：请不要直接抄作文用来交作业。你可以学习、借鉴、期待你写出更好的作文。

吃西瓜大赛

和吃西瓜大赛相关的作文：

说说你对这篇作文的看法吧

最新发表的关于西瓜的作文

最受欢迎的关于西瓜的作文