大数据 | Index
未读
本站关于大数据相关内容全部公开的决定
先前因保密等原因对部分大数据赛项的解释内容进行隐藏。 2026-03-06 现已全部公开 且等待后续补全 此站会一直维护和更新大数据中职技能大赛赛题(原ZZ052) 2026-02 -> 2026-03 已完全确认大数据赛道并入人工智能赛道 2026-03-06 本站更新将会放缓 部分时间用于人工智
IDEA Maven - MapReduce离线安装与打包
前言 首先,需要保证 IDEA 具有完善的 Maven 基础环境 若你的 IDEA 没有 Maven 的基础环境,请直接退出教程 Maven 基础环境指正常离线环境下无红无报错(Plugins 无报错) Start! 创建 Maven 项目
大数据 | MapReduce超级详细版
前情提要 准备工作 装好IDEA 创建好Maven项目 | ArchType-1 | ver 1.0.0 创建Maven项目 Pom.xml编写
大数据 | 数据清洗(pd第五套)
import pandas as pd
import numpy as np
import os
p = os.getcwd()
print(p)
src_file = f"{p}/src/distribution.csv"
srcdf = pd.read_csv(src_file)
sums =
大数据 | Hadoop 搭建
本文转载自 QingYingX's Blog: 原文地址 关闭防火墙&SELinux 防火墙 systemctl status firewalld 查看防火墙状态 systemctl stop firewalld 关闭防火墙 systemctl disable firewalld
CCF | Gradio智能体搭建
示例代码 import gradio as gr
import requests, json
url = "http://172.16.115.91:11434/api/generate"
def main(prompt, history):
advisor_data = {
CCF | 数据标注
示例代码 import csv
import random
import pandas as pd
import numpy as np
china_regions = {
"华北地区": {
"北京市": ["朝阳区", "海淀区", "西城区", "东城区", "丰台
CCF | 数据去重
示例代码 import csv
import pandas as pd
import numpy as np
csv_file = "data.csv"
df = pd.read_csv(csv_file)
df_no_duplicated = df.drop_duplicates(
CCF | 可视化-词云图
示例代码 import pandas as pd
import numpy as np
from pyecharts import options as opts
from pyecharts.charts import WordCloud
inputfile = "data_m2_t1_s2.
CCF | 可视化-中国地图
示例代码 import pandas as pd
import numpy as np
from pyecharts import options as opts
from pyecharts.charts import Map
inputfile = "data_m2_t1_s2.csv"
ou