[python每日一练]--0008:找出html中正文

题目链接:https://github.com/Show-Me-the-Code/show-me-the-code
我的github链接:https://github.com/wjsaya/python_spider_learn/tree/master/python_daily
个人博客地址:https://wjsaya.github.io
第 0008 题:一个HTML文件,找出里面的正文。

思路:

  1. 打开html文件;
  2. 呃。。。卡住了,不知道怎么搞了;

代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#!/usr/bin/env python3
#coding: utf-8
#Auther: wjsaya
#第 0008 题:一个HTML文件,找出里面的正文。
import re
import os
def analyze(file_name):
os.listdir()
print(os.getcwd())
line = open(file_name,'r',encoding='utf-8').read()
print (line)
# re.findal(r'',)
if __name__ == "__main__":
html = "./test.html"
analyze(html)

效果图:


0%