爬取博客文章保存为md
(纯净版去除多余内容,支持多平台(CSDN,简书,知乎等))
Two Method to choose
article2md(one).py:Method one
article2md(two).py:Method two(推荐)
article2批量版.py:对CSDN的某一专栏下全部文章进行转化成markdown
类似爬取下面这种一系列的文章
使用pip进行安装
pip install html2text
pip install lxml
pip install requests
pip install beautifulsoup4
思路:爬取目标html后利用html2text模块转化成markdown
思路:调用网站HTML/URL To Markdown的功能实现转化