[数据清洗]-看上去一样的数字
2018-06-18 00:20:00来源:未知 阅读 ()
这次想说一下,看起来都是正确的数值数据,在人和机器理解起来的差别
整合代码
# 演示数字和字符串的区别 two_char = '2' two_num = 2 def doubule(x): return x * 2 print('char:{}'.format(doubule(two_char))) print('num:{}'.format(doubule(two_num))) print('text:{}'.format(doubule('Test text end '))) # 报错,类型不对 print("2" + 2) # 模拟数据 import pandas as pd df = pd.DataFrame([[1,2,3,4,16],['1','2','3','4','F']],index =['Data1','Data2']) print(df) # 翻十倍,查看结果与预想结果的差别 df.apply(lambda x: x * 10) # 查看数据类型 df.dtypes # 尝试转换,报错 df.loc['Data2'] = pd.to_numeric(df.loc['Data2']) # 只转换能转换的,不能转换的赋值为 NaN(Not a Number) df.loc['Data2'] = pd.to_numeric(df.loc['Data2'] ,errors='coerce') # 查看成功转换后的结果 df.loc['Data2'] # 再次运算,查看结果与预想结果的差别 df = df.apply(lambda x: x * 10) print(df) # 查看数据类型 df.dtypes
更多关于数据清洗的内容可以关注知乎上的专栏“数据清洗”
知乎 https://zhuanlan.zhihu.com/p/32681964
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- python_0基础开始_day07 2019-08-13
- Django和前端用ajax传输json等数据 2019-08-13
- 链接 Mysql 创建 数据库和创表,增加数据 2019-08-13
- Python数据基础类型-列表 2019-08-13
- JavaScript获取Django模板中指定键值的数据,使用过滤器 2019-08-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash