2020-03-18 00:41:53    13    0    0
 与聚合函数一样,开窗函数也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值,开窗函数可以为每组返回多个值,它对一组值进行操作,不需要使用GROUP BY子句对数据进行分组,能够在同一行中同时返回基础行的列和聚合列。

开窗函数语法

开窗函数的语法为:over(partition by 列名1 order by 列名2 ),括号中的两个关键词partition by 和order by 可以只出现一个。over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。

开窗函数主要分为两类:

1、聚合开窗函数

很多聚合函数都可以用作窗口函数的运算,如sum\avg\max\min\count.

聚合开窗函数只能使用partition by子句,order by不能与聚合开窗函数一同使用。

python    2020-02-26 23:13:51    14    0    0

读写文件

读取文件

read_csv()

  1. import pandas as pd
  2. data = pd.read_csv('C:\\Users\\xiaoxiao\\Desktop\\test.csv')
  3. print(data)
  4. >>> longitude latitude age uid
  5. 0 -0.697511 37.998928 18 100001
  6. 1 -92.407906 34.622064 18 100002
  7. 2 -124.126868 40.790182 18 100003
  8. 3 -76.552708 37.178889 21 100004
  9. 4 -87.675790 41.437726 18 100005
  10. 5 -83.881972 33.996578 18 100006

设置列名

参数:header、names

当选择默认值或header=0时,将首行设为列名。如果列名被传入明确值就令header=None。注意,当header=0时,即使列名被传参也会被覆盖。

  1. data1 = pd.read_csv('C:\\Users\\xiaoxiao\\Desktop\\test.csv', header=2) # header:指定第几行来作为列名,默认为0
  2. print(data1)
  3. >>> -92.4079058 34.6220642 18 100002
  4. 0 -124.126868 40.790182 18 100003
  5. 1 -76.552708 37.178889 21 100004
  6. 2 -87.675790 41.437726 18 100005
  7. 3 -83.881972 33.996578 18 100006
  8. data1 = pd.read_csv('C:\\Users\\xiaoxiao\\Desktop\\test.csv',header=0, names=['a','b','c','d']) #重新设置列名,覆盖默认第一行的列名
  9. print(data1)
  10. >>> a
python    2020-02-25 15:54:04    7    0    0

python函数的参数

位置参数

调用函数时根据函数定义的参数位置来传递参数。位置参数一旦定义,在调用函数时,就必须传入对应的参数值。

  1. def infor(name, age):
  2. print('人员信息:name: {0}, age: {1}'.format(name, age))
  3. infor('xiaoxiao', 18)
  4. >>> 人员信息:name: xiaoxiao, age: 18

默认参数

  1. def infor(name, age, city='beijing'):
  2. print('人员信息:name: {0}, age: {1}, city:{2}'.format(name, age, city))
  3. infor('xiaoxiao', 18)
  4. infor('xiaoxiao', 18,'shanghai')
  5. >>> 人员信息:name: xiaoxiao, age: 18, city:beijing
  6. >>> 人员信息:name: xiaoxiao, age: 18, city:shanghai

可变参数

关键字参数

命名关键字参数

参数组合

python    2020-02-16 23:11:22    30    0    0

virtualenvwrapper 是一个基于virtualenv之上的工具,它将所有的虚拟环境统一管理

一、安装virtualenvwrapper:

 

 pip install virtualenvwarepper 或 pip3 install virtualenvwrapper

 

配置环境变量:环境变量WORKON_HOME,如果不配置环境变量,创建后的虚拟环境在当前用户目录下,配置后就在变量值的目录下

二、virtuaenvwrapper基本使用:


1、创建虚拟环境:

mkvirtualenv -p 解释器位置 环境名称 #解释器可选
mkvirtualenv ucenter #创建名为ucenter的虚拟环境

 

2、激活虚拟环境:

 workon ucenter

 

3、退出当前虚拟环境:

 deactivate

 

4、列出所有虚拟环境:

 lsvirtualenv

 

5、删除虚拟环境:

 rmvirtualenv ucenter

 

6、进入虚拟环境所在目录:

 cdvirtualenv

 

2020-02-16 11:04:00    16    0    0

2020.2.16,天气晴,宅家隔离的第17天,春天似乎快要来了 !

sql    2020-02-16 00:26:44    38    0    0

getdate 获取当前时间

  1. --getdate 获取当前时间
  2. select getdate()
  3. 结果:
  4. 2020-01-08 10:49:12

dateadd 原有时间加

  1. --dateadd 原有时间加(可以加负数)
  2. -- 参数可以为 daymonthyear等日期加相应的值
  3. select dateadd(MONTH,12,'2019-01-08 10:49:12');
  4. select dateadd(day,-30,'2019-01-08 10:49:12');
  5. select dateadd(year,-1,'2019-01-08 10:49:12');

datediff 两个时间的差 (后面-前面=返回值)

  1. --datediff 两个时间的差 (后面-前面=返回值)
  2. --参数可以为 daymonthyear等日期加相应的值
  3. select datediff(month,'2019-01-08 10:49:12','2019-03-03 10:49:12')

datepart获取日期的某个部分整数

  1. --参数可以为 hourdaymonthyear等日期加相应的值
  2. datepart(hour, '2020-01-01 12:00:00')
  3. datepart(hour, event_ts_pretty) as utc