1.python jupyter notebook 怎么运行程序
1. 安装Python3切换 Python | IPython/Jupyter搭建佳交互环境即可;
2. 利用jupyter的cell是可以运行python文件的,即在cell中运行如下代码:file.py;
3. file.py为要运行的python程序,结果会显示在该cell中 。
4. Jupyter的各种快捷键:
5. 执行当前cell,并自动跳到下一个cell:Shift Enter
6. 执行当前cell,执行后不自动调转到下一个cell:Ctrl-Enter
7. 是当前的cell进入编辑模式:Enter
8. 退出当前cell的编辑模式:Esc
9. 删除当前的cell:双D
10. 进入下一个cell:双A (前面)或 Alt+Enter(后面)
11. 为当前的cell加入line number:单L
12. 将当前的cell转化为具有一级标题的maskdown:单1
13. 将当前的cell转化为具有二级标题的maskdown:单2
14. 将当前的cell转化为具有三级标题的maskdown:单3
15. 为一行或者多行添加/取消注释:Crtl /
16. 撤销对某个cell的删除:z
17. 浏览器的各个Tab之间切换:Crtl PgUp和Crtl PgDn
18. 快速跳转到首个cell:Crtl Home
19. 快速跳转到最后一个cell:Crtl End
20. home 一行的开始
21. end 一行的结束
22. ctrl + ? 注释
23. shift + tab 查询函数的注解
2.python 怎么修改pandas的某个cell的值
数据缺失在大部分数据分析应用中都很常见,Pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据,他只是一个便于被检测出来的数据而已。
from pandas import Series,DataFramestring_data=Series(['abcd','efgh','ijkl','mnop'])print(string_data)print("。
..\n")print(string_data.isnull())12345671234567Python内置的None值也会被当作NA处理from pandas import Series,DataFramestring_data=Series(['abcd','efgh','ijkl','mnop'])print(string_data)print("。
..\n")string_data[0]=Noneprint(string_data.isnull())123456789123456789处理NA的方法有四种:dropna,fillna,isnull,notnullis(not)null,这一对方法对对象做出元素级的应用,然后返回一个布尔型数组,一般可用于布尔型索引。dropna,对于一个Series,dropna返回一个仅含非空数据和索引值的Series。
问题在于DataFrame的处理方式,因为一旦drop的话,至少要丢掉一行(列)。这里解决方法与前面类似,还是通过一个额外的参数:dropna(axis=0,how='any',thresh=None),how参数可选的值为any或者all.all仅在切片元素全为NA时才抛弃该行(列)。
thresh为整数类型,eg:thresh=3,那么一行当中至少有三个NA值时才将其保留。fillna,fillna(value=None,method=None,axis=0)中的value除了基本类型外,还可以使用字典,这样可以实现对不同列填充不同的值。
过滤数据: 对于一个Series,dropna返回一个仅含非空数据和索引值的Series:from pandas import Series,DataFramefrom numpy import nan as NAdata=Series([1,NA,3.5,NA,7])print(data.dropna())123456123456另一个过滤DataFrame行的问题涉及问题序列数据。假设只想留一部分观察数据,可以用thresh参数实现此目的:from pandas import Series,DataFrame, npfrom numpy import nan as NAdata=DataFrame(np.random.randn(7,3))data.ix[:4,1]=NAdata.ix[:2,2]=NAprint(data)print("。
..")print(data.dropna(thresh=2))不想滤除缺失的数据,而是通过其他方式填补“空洞”,fillna是最主要的函数。 通过一个常数调用fillna就会将缺失值替换为那个常数值:from pandas import Series,DataFrame, npfrom numpy import nan as NAdata=DataFrame(np.random.randn(7,3))data.ix[:4,1]=NAdata.ix[:2,2]=NAprint(data)print("。
..")print(data.fillna(0))若是通过一个字典调用fillna,就可以实现对不同列填充不同的值。from pandas import Series,DataFrame, npfrom numpy import nan as NAdata=DataFrame(np.random.randn(7,3))data.ix[:4,1]=NAdata.ix[:2,2]=NAprint(data)print("。
..")print(data.fillna({1:111,2:222}))可以利用fillna实现许多别的功能,比如可以传入Series的平均值或中位数:from pandas import Series,DataFrame, npfrom numpy import nan as NAdata=Series([1.0,NA,3.5,NA,7])print(data)print("。
..\n")print(data.fillna(data.mean()))123456789123456789检测和过滤异常值 异常值(outlier)的过滤或变换运算在很大程度上就是数组运算。
如下一个(1000,4)的标准正态分布数组:from pandas import Series,DataFrame, npfrom numpy import nan as NAdata=DataFrame(np.random.randn(1000,4))print(data.describe())print("\n。.找出某一列中绝对值大小超过3的项。
\n")col=data[3]print(col[np.abs(col) > 3] )print("\n。.找出全部绝对值超过3的值的行。
\n")print(col[(np.abs(data) > 3).any(1)] )移除重复数据 DataFrame的duplicated方法返回一个布尔型Series,表示各行是否是重复行。from pandas import Series,DataFrame, npfrom numpy import nan as NAimport pandas as pdimport numpy as npdata=pd.DataFrame({'k1':['one']*3+['two']*4, 'k2':[1,1,2,2,3,3,4]})print(data)print("。
..\n")print(data.duplicated())123456789123456789与此相关的还有一个drop_duplicated方法,它用于返回一个移除了重复行的DataFrame:from pandas import Series,DataFrame, npfrom numpy import nan as NAimport pandas as pdimport numpy as npdata=pd.DataFrame({'k1':['one']*3+['two']*4, 'k2':[1,1,2,2,3,3,4]})print(data)print("。
..\n")print(data.drop_duplicates())123456789123456789上面的两个方法会默认判断全部列,也可以指定部分列进行重复项判断,假设还有一列值,而只希望根据k1列过滤重复项。
from pandas import Series,DataFrame, npfrom numpy import nan as NAimport pandas as pdimport numpy as npdata=pd.DataFrame({'k1':['one']*3+['two']*4, 'k2':[1,1,2,2,3,3,4]})data['v1']=range(7)print(data)print("。
..\n")print(data.drop_duplicates(['k1']))和drop_duplicates默认保留第一个出现的值组合。传入take_last=True则保留最后一个:from pandas import Series,DataFrame, npfrom numpy import nan as NAimport pandas as pdimport numpy as npdata=pd.DataFrame({'k1':['one']*3+['two']*4, 'k2':[1,1,2,2,3,3。
3.python xlrd 我想用读取功能 读取cell中的值和format 重点是format 我需
读取TRUE时返回的是1,是因为TRUE这个值在excel文件中保存时就是真值类型0或1,而不是保存文本TRUE(节省存储空间)。数字也是这样的。
如果你想把读取时都变为文字,有两种方法。
1,在原excel文件中修改。将TRUE真值类型、数字类型转换成文本类型。
2,在xlrd读取过程中加入一些简单的判定,不同数据不同处理。
1
2
3
4
5
6
7
def read_cell(x,y):
if cell_type(x,y)==4: #4是真值类型(bool)
return "TRUE" if cell_value(x,y)==1 else "FALSE"
elif cell_type(x,y)==2: #2是数字类型(number)
return str(cell_value(x,y))
else:#其他类型不再一一列举,用到时再做增加
return cell_value(x,y)
4.python xlrd循环行列表数据
我把一些基本的操作方法告诉你,你自然就会解决这个问题了。
1、导入模块
import xlrd
2、打开Excel文件读取数据
data = xlrd.open_workbook('excelFile.xls')
3、使用技巧
获取一个工作表
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(0) #通过索引顺序获取
table = data.sheet_by_name(u'Sheet1')#通过名称获取
获取整行和整列的值(数组)
table.row_values(i)
table.col_values(i)
获取行数和列数
nrows = table.nrows
ncols = table.ncols
循环行列表数据
for i in range(nrows ):
print table.row_values(i)
单元格
cell_A1 = table.cell(0,0).value
cell_C4 = table.cell(2,3).value
使用行列索引
cell_A1 = table.row(0)[0].value
cell_A2 = table.col(1)[0].value
简单的写入
row = 0
col = 0
# 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
ctype = 1 value = '单元格的值'
xf = 0 # 扩展的格式化
table.put_cell(row, col, ctype, value, xf)
table.cell(0,0) #单元格的值'
table.cell(0,0).value #单元格的值'
转载请注明出处代码入门网 » pythoncell()