hello 大家好我是Monday,今天给大家介绍下如何利用pandas处理html中的表格转换成json落库。
前言:
我们打开同花顺
http://q.10jqka.com.cn/thshy/detail/code/881172/
我们查看下网页源码发现时table表格的数据
这时候我们就可以使用pandas 的to_html 来处理
代码如下
1 | import requests |
处理结果如下:
1 | [{'code': 300054, 'name': '鼎龙股份'}, {'code': 688019, 'name': '安集科技'}, {'code': 301319, 'name': '唯特偶'}, {'code': 688359, 'name': '三孚新科'}, {'code': 300285, 'name': '国瓷材料'}, {'code': 300481, 'name': '濮阳惠成'}, {'code': 688106, 'name': '金宏气体'}, {'code': 300684, 'name': '中石科技'}, {'code': 300655, 'name': '晶瑞电材'}, {'code': 300398, 'name': '飞凯材料'}, {'code': 300236, 'name': '上海新阳'}, {'code': 2741, 'name': '光华科技'}, {'code': 688268, 'name': '华特气体'}, {'code': 603002, 'name': '宏昌电子'}, {'code': 300346, 'name': '南大光电'}, {'code': 300429, 'name': '强力新材'}, {'code': 300576, 'name': '容大感光'}, {'code': 688550, 'name': '瑞联新材'}, {'code': 300537, 'name': '广信材料'}, {'code': 688150, 'name': '莱特光电'}] |
正常批量insert语句 df_list 就可以了(仅是小编的自己的习惯,转换成字典追加列表在批量入库)
(1)to_dict
1 | df_list = [] |
(2)to_sql
1 | from sqlalchemy import create_engine |
(3)to_excel
1 | df_list = [] |
结束语:
今天的分享就到这里了,欢迎大家关注微信公众号”菜鸟童靴“