当前位置: 首页 > news >正文

宁波公司网站开发招聘c 可以用来做网站吗

宁波公司网站开发招聘,c 可以用来做网站吗,wordpress二级分类列表,网站开发 足球球队信息最近#xff0c;有网友反映#xff0c;我的批量查字典工具换到其它的网站就不好用了。对此#xff0c;我想说的是#xff0c;互联网包罗万象#xff0c;网站的各种设置也有所不同#xff0c;并不是所有的在线字典都可以用Python爬取的。事实上#xff0c;很多网站为了防…最近有网友反映我的批量查字典工具换到其它的网站就不好用了。对此我想说的是互联网包罗万象网站的各种设置也有所不同并不是所有的在线字典都可以用Python爬取的。事实上很多网站为了防止被爬取内容早就提高了网站的安全级别不会让用户轻意爬取内容的。 由于这名网友想要的是韩语翻译所以我就不能拿原来的网站来操作了只好去网上查询网速快、又不对爬虫有限制的网站来操作。终于探索出了爬取某字典网站上内容的方法。 一、用BeautifulSoup获取翻译 这是一个字典网站也是一个双语句库网站对于汉语的韩语翻译我们可以通过requests来获取网页源文再用BeautifulSoup进行解析然后用soup.find()查找想要的标签信息和Class提取文本信息然后再写入到xls文件就可以了代码如下 import xlwt import requests from bs4 import BeautifulSoupheaders {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37}def get_word(word):urlfhttps://zh.glosbe.com/zh/ko/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果result soup.find(div, class_inline leading-10)if result:return result.text.split()[0]else:return 未找到翻译def process_txt_file(filename):# 创建工作簿wb xlwt.Workbook()# 创建表单sh wb.add_sheet(sheet 1)with open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for index,word in enumerate(words):sh.write(index,0,word)sh.write(index,1,get_word(word))wb.save(translation_results.xls) #调用函数并传入txt文件路径 process_txt_file(words.txt) 二、用openpyxl来写入xlsx文件 上面的代码中采用的是xlwt来写入到xls文件我们也可以改用openpyxl同时我们还可以通过soup.h3.string来更快地定位所需要的位置信息。这次我们把查询的内容由韩语改为英文代码优化如下 import requests from bs4 import BeautifulSoup import openpyxl headers {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37} def get_word(word):urlfhttps://zh.glosbe.com/zh/en/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果#results soup.find_all(div, class_py-2 flex)results soup.h3.stringif results:return results.strip()else:return 未找到翻译 # if results: # for result in results: # print(result.replace(\n\n\n,\n).strip()) # else: # return 未找到翻译 def process_txt_file(filename):workbook openpyxl.Workbook()sheet workbook.activewith open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for index, word in enumerate(words):translation get_word(word)sheet.cell(rowindex 1, column1).value wordsheet.cell(rowindex 1, column2).value translationworkbook.save(translation_results.xlsx)#调用函数并传入txt文件路径 process_txt_file(words.txt) 三、提取双语例句到xlsx文件 先上效果以下是多个关键词及其相关例句的图示 相关代码如下 import requests from bs4 import BeautifulSoup import openpyxl headers {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37} def get_word(word):urlfhttps://zh.glosbe.com/zh/en/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果results soup.find_all(div, class_py-2 flex)lst[]if results:for result in results:text result.text.replace(\n\n\n,\n).strip()lst.append(text.split(\n))return lstelse:return 未找到翻译def process_txt_file(filename):workbook openpyxl.Workbook()sheet workbook.activewith open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for word in words:sheet.append([word])paras get_word(word)for para in paras:sheet.append(para)workbook.save(translation.xlsx)#调用函数并传入txt文件路径 process_txt_file(words.txt) 四、学后的反思 1. 爬虫不是万能的不能完全依靠爬虫去获取一切网上的信息毕竟有很多网站的案例防御机制是针对爬虫的 2. 利用BeautifulSoup是很不错的解析、提取网页标签的方法如果无法完全获取网页信息就要考虑带上headers,cookies等信息。 3. 写入excel文件有多种 方法列表写入Excel可以考虑sheet.append()方法简单实用。
http://www.yutouwan.com/news/199960/

相关文章:

  • 建设网站服务器wordpress 主机优化
  • 做淘客需要用的网站wordpress登录页面图标
  • 建设什么网站可以上传视频python3 网站开发实例
  • 凯盛建设公司网站做的网站为什么图片看不了怎么办
  • 四平市住房和城乡建设部网站什么网站可以设计接单做
  • 长春建设信息网站wordpress动漫博客主题
  • 做的网站上传到服务器吗凡科做网站行吗
  • wordpress怎么优化图片网站seo多少钱
  • 清苑区建设网站找那家公司网站收录 百度自动增加参数
  • 自建网站服务器备案礼品网站制作
  • 直播一级a做爰片免费网站做网站的协议书和计划书
  • 余姚关键词优化公司邯郸网站建设优化
  • 网站logo怎么做的移动互联网开发是什么
  • 网站建设 正邦秦皇岛建设路小学网站
  • 网站开发建设需多少钱wordpress网站邀请码
  • 罗湖网站建设 信科网络网站空间维护
  • 广告位网站建设高端酒店开发
  • 佛山制作网站wordpress上百度吗
  • 网站内容创意做类似淘宝的网站需多少资金
  • 肥东建设网站网站建设视频vs
  • dede 网站标题邗江区网站建设套餐
  • 免费搭建手机自助网站电子邮箱怎么申请注册
  • 温州建设学校网站建五金方面的网站
  • 网站建设致谢做外贸做的很好的网站
  • 无固定ip 建设网站网络推广方案联系昔年下拉
  • 自己做的网站无法访问重庆最新消息今天
  • 免费包装设计网站深圳做夜场做网站
  • 做窗帘的网站中国纪检监察报什么级别
  • 正规的装饰行业网站建设公司黄瓜视频ios
  • 如何设计营销 网站建设建筑网站起名