标签 - python

python    2020-07-16 21:14:14    58    0    0

数据预处理

# 加载数据
data = pd.read_csv('C:\\Users\\qinxiao\\Desktop\\test\\test_1.csv')

# 可以选择加载哪几列
data1=pd.read_csv('C:\\Users\\qinxiao\\Desktop\\test\\test_1.csv',header=0,usecols=['uid','story_id','age'])

# 列重命名
data = data.rename(columns = {'uid':'userid','story_id':'sid'})

# 去除不必要的字符
data.columns=map(lambda x: x.replace('_',''),data.columns)
python    2020-07-02 21:10:14    82    0    0
from matplotlib import pyplot as plt
import random
from matplotlib import font_manager

###折线图

# 设置中文字体
my_font = font_manager.FontProperties(fname='C:\\Windows\\Fonts\\simhei.ttf')

x = range(0, 120)
y = [random.randint(20, 35) for i in range(120)]  # 生成120个20-35的数字

# 设置图片大小和清晰度
plt.figure(figsize=(20, 8), dpi=200)
plt.plot(x, y)
python    2020-03-09 15:12:11    37    0    0
# 重命名列名
df.columns = ['a','b','c']

# 批量更改列名
df.rename(columns=lambda x: x + 1)

# 选择性更改列名
df.rename(columns={'old_name': 'new_ name'})

# 更改索引列
df.set_index('column_one')

# 批量重命名索引
df.rename(index=lambda x: x + 1)
python    2018-01-06 17:31:13    25    0    0

Pandas操作数据库

import pandas as pd
import sqlalchemy

# 连接 Mysql 数据库
engine = sqlalchemy.create_engine('mysql+pymysql://root:root@localhost:3306/test')

sql_string = """
select *
from student_tbl
"""

# 将SQL查询或数据库表读取到DataFrame中:
# da= pd.read_sql('student_tbl',engine)
# print(da)
data = pd.read_sql(sql_string, engine)
print(data)
python    2017-12-10 19:34:18    53    0    0

读写文件 

读取文件

>>> import pandas as pd

>>> data = pd.read_csv('C:\\Users\\xiaoxiao\\Desktop\\test.csv')
>>> print(data)

    longitude   latitude  age     uid
0    -0.697511  37.998928   18  100001
1   -92.407906  34.622064   18  100002
2  -124.126868  40.790182   18  100003
3   -76.552708  37.178889   21  100004
4   -87.675790  41.437726   18  100005
5   -83.881972  33.996578   18  100006
python    2017-12-02 21:45:13    23    0    0
import pandas as pd
import numpy as np

#######################
基本功能

s = pd.Series([1, 44, 1])
print(s)
print(s.values)
print(s.index)
a = pd.Series([1, 44, 1], index=['a', 'b', 'c'])
print(a)
print(a.index)
print(a['a'])
print(a[['a', 'c']])
print(a[a > 1])
print(a * 2)
python    2017-11-18 20:43:19    20    0    0
import numpy as np

创建ndarray
np.array

data1 = [6, 0, 3]
arr1 = np.array(data1)
print(arr1)

data1 = [[6, 0, 3], [2, 4, 5]]
arr1 = np.array(data1, dtype=np.int32)
print(arr1)
print(arr1.ndim)
print(arr1.shape)
print(arr1.dtype)
python    2017-08-26 22:47:09    20    0    0

实例(对象)方法

实例方法,该实例属于对象,该方法的第一个参数是当前实例,拥有当前类以及实例的所有特性。需要实例化,用对象调用

@classmethod 类方法

类方法,不需要实例化,也不需要self参数,需要一个cls参数,可以用类名调用,也可以用对象来调用。

原则上,类方法是将类本身作为对象进行操作的方法。假设有个方法,且这个方法在逻辑上采用类本身作为对象来调用更合理,那么这个方法就可以定义为类方法

@staticmethod 静态方法

静态方法,不需要实例化,不需要self和cls等参数,就跟使用普通的函数一样,只是封装在类中

python    2017-07-23 15:45:42    16    0    0

基于字符read & write

read 以读文件的模式打开一个文件对象 

f = open('C:/Users/xiaoxiao/Desktop/a.txt', 'r')

如果文件打开成功,接下来,调用read()方法可以一次读取文件的全部内容,Python把内容读到内存

f.read()
python    2017-07-16 21:14:14    36    0    0

python函数的参数

位置参数 调用函数时根据函数定义的参数位置来传递参数。位置参数一旦定义,在调用函数时,就必须传入对应的参数值。

def infor(name, age):
    print('人员信息:name: {0}, age: {1}'.format(name, age))

>>> infor('xiaoxiao', 18)
人员信息:name: xiaoxiao, age: 18