当前位置: 首页 > news >正文

工会网站建设比较好的工会打开一个不良网站提示创建成功

工会网站建设比较好的工会,打开一个不良网站提示创建成功,网站托管价格,linux做ppt下载网站前言 前段时间有同学在微信群里提问#xff0c;要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架#xff08;可以帮助 .NET 工程师快速的完成爬虫的开发#xff09;#xff1a;DotnetSpider。 注…前言 前段时间有同学在微信群里提问要使用.NET开发一个简单的爬虫功能但是没有做过无从下手。今天给大家推荐一个轻量、灵活、高性能、跨平台的分布式网络爬虫框架可以帮助 .NET 工程师快速的完成爬虫的开发DotnetSpider。 注意为了自身安全请在国家法律允许范围内开发网络爬虫功能。 框架设计图 整个爬虫设计是纯异步的利用消息队列进行各个组件的解耦若是只需要单机爬虫则不需要做任何额外的配置默认使用了一个内存型的消息队列若是想要实现一个纯分布式爬虫则需要引入一个消息队列即可后面会详细介绍如何实现一个分布式爬虫。 框架源码 开发爬虫需求 爬取博客园10天推荐排行第一页的文章标题、文章简介和文章地址并将其保存到对应的txt文本中。 请求地址https://www.cnblogs.com/aggsite/topdiggs 快速开始 创建SpiderSample控制台 安装DotnetSpider Nuget包 搜索DotnetSpider 添加Serilog日志组件 搜索Serilog.AspNetCore RecommendedRankingModel public class RecommendedRankingModel{/// summary/// 文章标题/// /summarypublic string ArticleTitle { get; set; }/// summary/// 文章简介/// /summarypublic string ArticleSummary { get; set; }/// summary/// 文章地址/// /summarypublic string ArticleUrl { get; set; }} RecommendedRankingSpider public class RecommendedRankingSpider : Spider{public RecommendedRankingSpider(IOptionsSpiderOptions options,DependenceServices services,ILoggerSpider logger) : base(options, services, logger){}public static async Task RunAsync(){var builder  Builder.CreateDefaultBuilderRecommendedRankingSpider();builder.UseSerilog();builder.UseDownloaderHttpClientDownloader();builder.UseQueueDistinctBfsSchedulerHashSetDuplicateRemover();await builder.Build().RunAsync();}protected override async Task InitializeAsync(CancellationToken stoppingToken  default){// 添加自定义解析AddDataFlow(new Parser());// 使用控制台存储器AddDataFlow(new ConsoleStorage());// 添加采集请求await AddRequestsAsync(new Request(https://www.cnblogs.com/aggsite/topdiggs){// 请求超时10秒Timeout  10000});}class Parser : DataParser{public override Task InitializeAsync(){return Task.CompletedTask;}protected override Task ParseAsync(DataFlowContext context){var recommendedRankingList  new ListRecommendedRankingModel();// 网页数据解析var recommendedList  context.Selectable.SelectList(Selectors.XPath(.//article[classpost-item]));foreach (var news in recommendedList){var articleTitle  news.Select(Selectors.XPath(.//a[classpost-item-title]))?.Value;var articleSummary  news.Select(Selectors.XPath(.//p[classpost-item-summary]))?.Value?.Replace(\n, ).Replace( , );var articleUrl  news.Select(Selectors.XPath(.//a[classpost-item-title]/href))?.Value;recommendedRankingList.Add(new RecommendedRankingModel{ArticleTitle  articleTitle,ArticleSummary  articleSummary,ArticleUrl  articleUrl});}using (StreamWriter sw  new StreamWriter(recommendedRanking.txt)){foreach (RecommendedRankingModel model in recommendedRankingList){string line  $文章标题{model.ArticleTitle}\r\n文章简介{model.ArticleSummary}\r\n文章地址{model.ArticleUrl};sw.WriteLine(line \r\n );}}return Task.CompletedTask;}}} Program调用 internal class Program{static async Task Main(string[] args){Console.WriteLine(Hello, World!);await RecommendedRankingSpider.RunAsync();Console.WriteLine(数据抓取完成);}} 抓取数据和页面数据对比 抓取数据 页面数据 项目源码地址 更多项目实用功能和特性欢迎前往项目开源地址查看别忘了给项目一个Star支持。 GitHub源码地址GitHub - dotnetcore/DotnetSpider: DotnetSpider, a .NET standard web crawling library. It is lightweight, efficient and fast high-level web crawling scraping framework GitHub wikiHome · dotnetcore/DotnetSpider Wiki · GitHub 优秀项目和框架精选 该项目已收录到C#/.NET/.NET Core优秀项目和框架精选中关注优秀项目和框架精选能让你及时了解C#、.NET和.NET Core领域的最新动态和最佳实践提高开发工作效率和质量。坑已挖欢迎大家踊跃提交PR推荐或自荐让优秀的项目和框架不被埋没。 https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/DotNetProjectPicks.md 文章转载自追逐时光者 原文链接https://www.cnblogs.com/Can-daydayup/p/17884311.html
http://www.sadfv.cn/news/360625/

相关文章:

  • 移动端网站怎么做的佛山网站建设网站制作公司哪家好
  • 国内网站建设郑州app软件公司
  • 个人网站的名称深圳网站建设找哪家
  • 制作网站注册登录模块的思维导图抖音推广引流
  • 商城类网站建设 数据库大兴区企业网站建设
  • 站长工具综合查询站长工具百度推广售后
  • 网站如何做定级备案新东方英语线下培训学校
  • 深圳.网站建设网站访问不了的原因
  • 网站开发 实训 报告企业logo设计创意
  • 搭建网站用什么系统网站底部版权信息
  • 临沂网站优化公司wordpress个人博客模版
  • 福田专业网站建设公司哪家好游戏小程序开发定制
  • 免费搭建企业网站彭州做网站的公司
  • 双语版网站案例免费建立个人网站申请
  • 网站建设数据库代码网站建设有哪些分类
  • 今标 网站建设网站主机选择
  • wordpress 注册 登陆长沙百度快速排名优化
  • 怎么跟客户介绍网站建设中企动力潍坊分公司
  • 怎么修改php网站云主机购买
  • 网站商城建设方案网站后台数据
  • 电子商务网站建设技巧制作游戏的网站
  • 网站建设软件定制开发网站建设引擎
  • 公司网站域名备案流程社交网站盈利吗
  • 企业网站管理制度建设浪花直播
  • 外贸专业网站建设sanitize_user wordpress
  • 做亚马逊网站一般发什么快递公司wordpress轮翻图参数
  • 如何去掉链接wordpress想做个卷帘门百度优化网站
  • 无锡设计网站找哪家时尚网站建设
  • 做广告牌子的电话安徽seo推广公司
  • 怎么做车载mp3下载网站合肥网站优化价格