当前位置：首页 > news >正文

那里做网站比较好哪些行业做网站多

news 2025/12/16 9:43:36

那里做网站比较好,哪些行业做网站多,最快的wordpress,热搜词排行榜目录赛制官方链接活动背景活动时间#xff1a;即日起-12月31日17点数据说明世界杯成绩信息表#xff1a;WorldCupsSummary 世界杯比赛比分汇总表#xff1a;WorldCupMatches.csv 世界杯球员信息表#xff1a;WorldCupPlayers.csv 代码实现赛制官方链接世界杯…目录赛制官方链接活动背景活动时间即日起-12月31日17点数据说明世界杯成绩信息表WorldCupsSummary 世界杯比赛比分汇总表WorldCupMatches.csv 世界杯球员信息表WorldCupPlayers.csv 代码实现赛制官方链接世界杯数据可视化分析_学习赛_天池大赛-阿里云天池活动背景 2022世界杯在卡塔尔正如火如荼的进行作为全球最受欢迎的体育运动自然会吸引全世界无数球迷的目光这也是历史上首次在冬季举办的世界杯。让我们一起来分析世界杯历史数据看看能得出哪些有意思的结论吧。本次数据分析项目包括3张来自FIFA官方数据整理的基础数据表期待看到各位数据分析探索能手发挥想象力开展各种分析。活动时间即日起-12月31日17点数据说明世界杯成绩信息表WorldCupsSummary 包含了所有21届世界杯赛事1930-2018的比赛主办国、前四名队伍、总参赛队伍、总进球数、现场观众人数等汇总信息包括如下字段 Year: 举办年份HostCountry: 举办国家Winner: 冠军队伍Second: 亚军队伍Third: 季军队伍Fourth: 第四名队伍GoalsScored: 总进球数QualifiedTeams: 总参赛队伍数MatchesPlayed: 总比赛场数Attendance: 现场观众总人数HostContinent: 举办国所在洲WinnerContinent: 冠军国家队所在洲世界杯比赛比分汇总表WorldCupMatches.csv 包含了所有21届世界杯赛事1930-2014单场比赛的信息包括比赛时间、比赛主客队、比赛进球数、比赛裁判等信息。包括如下字段 Year: 比赛所属世界杯举办年份Datetime: 比赛具体日期Stage: 比赛所属阶段包括小组赛GroupX、16进8Quarter-Final、半决赛Semi-Final、决赛Final等Stadium: 比赛体育场City: 比赛举办城市Home Team Name: 主队名Away Team Name: 客队名Home Team Goals: 主队进球数Away Team Goals: 客队进球数Attendance: 现场观众数Half-time Home Goals: 上半场主队进球数Half-time Away Goals: 上半场客队进球数Referee: 主裁Assistant 1: 助理裁判1Assistant 2: 助理裁判2RoundID: 比赛所处阶段ID和Stage字段对应MatchID: 比赛IDHome Team Initials: 主队名字缩写Away Team Initials: 客队名字缩写世界杯球员信息表WorldCupPlayers.csv RoundID: 比赛所处阶段ID同比赛信息表的RoundID字段MatchID: 比赛IDTeam Initials: 队伍名Coach Name: 教练名Line-up: 首发/替补Shirt Number: 球衣号码Player Name: 队员名Position: 比赛角色包括CCaptain, GKGoalkeeperEvent: 比赛事件包括进球、红/黄牌等数据的话可以在比赛官网获得以下提供思路代码实现使用Jupyter notbook工具代码实现 import os#operation system import gc#gabbage collection import mathimport pandas as pd import numpy as npfrom sklearn.linear_model import SGDRegressor, LinearRegression, Ridge#回归 from sklearn.preprocessing import MinMaxScaler#数据归一化from sklearn.model_selection import StratifiedKFold, KFold#生成交叉验证数据集 from sklearn.metrics import log_loss from sklearn.model_selection import train_test_split from sklearn.preprocessing import OneHotEncoderimport matplotlib.pyplot as plt import time import warnings warnings.filterwarnings(ignore)# 导入数据 #获取数据 path1 rD:\Bigdata\Anaconda\A_file\train.csv train pd.read_csv(path1) train.head() path2 rD:\Bigdata\Anaconda\A_file\testA.csv testpd.read_csv(path2) test.head()#数据预处理减少内存占用 def reduce_mem_usage(df):start_mem df.memory_usage().sum() / 1024**2 print(Memory usage of dataframe is {:.2f} MB.format(start_mem))for col in df.columns:col_type df[col].dtypeif col_type ! object:c_min df[col].min()c_max df[col].max()if str(col_type)[:3] int:if c_min np.iinfo(np.int8).min and c_max np.iinfo(np.int8).max:df[col] df[col].astype(np.int8)elif c_min np.iinfo(np.int16).min and c_max np.iinfo(np.int16).max:df[col] df[col].astype(np.int16)elif c_min np.iinfo(np.int32).min and c_max np.iinfo(np.int32).max:df[col] df[col].astype(np.int32)elif c_min np.iinfo(np.int64).min and c_max np.iinfo(np.int64).max:df[col] df[col].astype(np.int64) else:if c_min np.finfo(np.float16).min and c_max np.finfo(np.float16).max:df[col] df[col].astype(np.float16)elif c_min np.finfo(np.float32).min and c_max np.finfo(np.float32).max:df[col] df[col].astype(np.float32)else:df[col] df[col].astype(np.float64)else:df[col] df[col].astype(category)end_mem df.memory_usage().sum() / 1024**2 print(Memory usage after optimization is: {:.2f} MB.format(end_mem))print(Decreased by {:.1f}%.format(100 * (start_mem - end_mem) / start_mem))return df#简单预处理 train_list []#定义一个列表for items in train.values:train_list.append([items[0]] [float(i) for i in items[1].split(,)] [items[2]])train pd.DataFrame(np.array(train_list)) train.columns [id] [s_str(i) for i in range(len(train_list[0])-2)] [label] train reduce_mem_usage(train)test_list[] for items in test.values:test_list.append([items[0]] [float(i) for i in items[1].split(,)])test pd.DataFrame(np.array(test_list)) test.columns [id] [s_str(i) for i in range(len(test_list[0])-1)] test reduce_mem_usage(test)#训练数据/测试数据准备 x_train train.drop([id,label], axis1) y_train train[label] x_testtest.drop([id], axis1)# 半决赛4强队伍次数统计 countries hist_worldcup[[Winner,Second,Third,Fourth]].apply(pd.value_counts).reset_index().fillna(0) countries[SemiFinal] countries[Winner] countries[Second]countries[Third]countries[Fourth] countries[Final] countries[Winner]countries[Second] countries# 设置颜色 clrs [blue if (i8) else y if (5i8) else purple if (3i5) else orangered if (i2) else red for i in countries[SemiFinal]]fig, ax plt.subplots(figsize(20,8)) plt.title(SemiFinal Statistic) sns.barplot(datacountries,xindex,ySemiFinal,paletteclrs,linewidth2.5, edgecolor.2) ax.spines[right].set_visible(False) ax.spines[top].set_visible(False) ax.spines[left].set_visible(False) ax.spines[bottom].set_visible(False) ax.set_ylabel(None) ax.set_xlabel(None) plt.tick_params(labelleftFalse, leftFalse,labelsize14)plt.xticks(rotation45)

查看全文

http://www.sadfv.cn/news/203582/