当前位置: 首页 > news >正文

工会网站建设比较好的工会打开一个不良网站提示创建成功

工会网站建设比较好的工会,打开一个不良网站提示创建成功,网站托管价格,linux做ppt下载网站前言 前段时间有同学在微信群里提问#xff0c;要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架#xff08;可以帮助 .NET 工程师快速的完成爬虫的开发#xff09;#xff1a;DotnetSpider。 注…前言 前段时间有同学在微信群里提问要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架可以帮助 .NET 工程师快速的完成爬虫的开发DotnetSpider。 注意为了自身安全请在国家法律允许范围内开发网络爬虫功能。 框架设计图 整个爬虫设计是纯异步的利用消息队列进行各个组件的解耦若是只需要单机爬虫则不需要做任何额外的配置默认使用了一个内存型的消息队列若是想要实现一个纯分布式爬虫则需要引入一个消息队列即可后面会详细介绍如何实现一个分布式爬虫。 框架源码 开发爬虫需求 爬取博客园10天推荐排行第一页的文章标题、文章简介和文章地址并将其保存到对应的txt文本中。 请求地址https://www.cnblogs.com/aggsite/topdiggs 快速开始 创建SpiderSample控制台 安装DotnetSpider Nuget包 搜索DotnetSpider 添加Serilog日志组件 搜索Serilog.AspNetCore RecommendedRankingModel public class RecommendedRankingModel{/// summary/// 文章标题/// /summarypublic string ArticleTitle { get; set; }/// summary/// 文章简介/// /summarypublic string ArticleSummary { get; set; }/// summary/// 文章地址/// /summarypublic string ArticleUrl { get; set; }} RecommendedRankingSpider public class RecommendedRankingSpider : Spider{public RecommendedRankingSpider(IOptionsSpiderOptions options,DependenceServices services,ILoggerSpider logger) : base(options, services, logger){}public static async Task RunAsync(){var builder  Builder.CreateDefaultBuilderRecommendedRankingSpider();builder.UseSerilog();builder.UseDownloaderHttpClientDownloader();builder.UseQueueDistinctBfsSchedulerHashSetDuplicateRemover();await builder.Build().RunAsync();}protected override async Task InitializeAsync(CancellationToken stoppingToken  default){// 添加自定义解析AddDataFlow(new Parser());// 使用控制台存储器AddDataFlow(new ConsoleStorage());// 添加采集请求await AddRequestsAsync(new Request(https://www.cnblogs.com/aggsite/topdiggs){// 请求超时10秒Timeout  10000});}class Parser : DataParser{public override Task InitializeAsync(){return Task.CompletedTask;}protected override Task ParseAsync(DataFlowContext context){var recommendedRankingList  new ListRecommendedRankingModel();// 网页数据解析var recommendedList  context.Selectable.SelectList(Selectors.XPath(.//article[classpost-item]));foreach (var news in recommendedList){var articleTitle  news.Select(Selectors.XPath(.//a[classpost-item-title]))?.Value;var articleSummary  news.Select(Selectors.XPath(.//p[classpost-item-summary]))?.Value?.Replace(\n, ).Replace( , );var articleUrl  news.Select(Selectors.XPath(.//a[classpost-item-title]/href))?.Value;recommendedRankingList.Add(new RecommendedRankingModel{ArticleTitle  articleTitle,ArticleSummary  articleSummary,ArticleUrl  articleUrl});}using (StreamWriter sw  new StreamWriter(recommendedRanking.txt)){foreach (RecommendedRankingModel model in recommendedRankingList){string line  $文章标题{model.ArticleTitle}\r\n文章简介{model.ArticleSummary}\r\n文章地址{model.ArticleUrl};sw.WriteLine(line \r\n );}}return Task.CompletedTask;}}} Program调用 internal class Program{static async Task Main(string[] args){Console.WriteLine(Hello, World!);await RecommendedRankingSpider.RunAsync();Console.WriteLine(数据抓取完成);}} 抓取数据和页面数据对比 抓取数据 页面数据 项目源码地址 更多项目实用功能和特性欢迎前往项目开源地址查看别忘了给项目一个Star支持。 GitHub源码地址GitHub - dotnetcore/DotnetSpider: DotnetSpider, a .NET standard web crawling library. It is lightweight, efficient and fast high-level web crawling scraping framework GitHub wikiHome · dotnetcore/DotnetSpider Wiki · GitHub 优秀项目和框架精选 该项目已收录到C#/.NET/.NET Core优秀项目和框架精选中关注优秀项目和框架精选能让你及时了解C#、.NET和.NET Core领域的最新动态和最佳实践提高开发工作效率和质量。坑已挖欢迎大家踊跃提交PR推荐或自荐让优秀的项目和框架不被埋没。 https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/DotNetProjectPicks.md 文章转载自追逐时光者 原文链接https://www.cnblogs.com/Can-daydayup/p/17884311.html
http://www.yutouwan.com/news/360625/

相关文章:

  • 北滘企业网站开发网站开发项目怎么接
  • 微信企业邮箱怎么注册网站全站优化
  • 网站建设整个流程图北京设计网站建设
  • 比较好用的网站山西做网站的企业
  • 太原自助建站软件wp网站怎么用插件做html网页
  • 建设网站江西免费隐私网站推广
  • 网站建设声明函下载网址大全到桌面
  • 艾特软件 网站建设网站软件下载大全
  • 英国T4学生签证 可以做网站吗深圳手工外发加工网
  • 网站的维护方案桃江县建设局网站
  • 做网站时怎样申请域名网站估值
  • 装修公司网站如何做网络推广产品推广介绍
  • 做选择网站中国十大建筑设计公司排名
  • 乐达淄博网站建设制作宿州城乡建设局网站
  • 建立网站的流程是什么免费域名注册网站源码
  • 网站集约化建网站用自己的主机做服务器
  • 建设网站的意义 作用蝉知cms wordpress
  • 做外贸找工厂货源网站qt 网站开发
  • 个人怎么做淘宝客网站360建筑网app下载
  • 公司取名字seo教程搜索引擎优化入门与进阶
  • seo是东莞企业网站排seo租房网站
  • 网站开发图网站反向代理怎么做
  • 电商设计培训课程怎么做百度seo网站
  • 建个购物网站网站主页与导航栏的设计
  • 阿里巴巴国际站入口动漫设计一个月能挣多少钱
  • 咸阳网站开发哪家好wordpress显示产品类别
  • 莆田做网站公司东莞百推网络
  • 微电影网站源码烟台58同城网站建设
  • 哪个网站可以接图纸做全国最火的电商代运营公司
  • 邢台市教育局网站建设seo优化的好处