分类: 大数据 | Index | Summer 的博客

大数据 | Index 未读

先前因保密等原因对部分大数据赛项的解释内容进行隐藏。 2026-03-06 现已全部公开且等待后续补全此站会一直维护和更新大数据中职技能大赛赛题（原ZZ052） 2026-02 -> 2026-03 已完全确认大数据赛道并入人工智能赛道 2026-03-06 本站更新将会放缓部分时间用于人工智

CCF 大数据 2026-03-06

大数据 | IndexJava 未读

前言首先，需要保证 IDEA 具有完善的 Maven 基础环境若你的 IDEA 没有 Maven 的基础环境，请直接退出教程 Maven 基础环境指正常离线环境下无红无报错（Plugins 无报错） Start! 创建 Maven 项目

2025-11-18

大数据 | IndexJava 未读

大数据 | MapReduce超级详细版

前情提要准备工作装好IDEA 创建好Maven项目 | ArchType-1 | ver 1.0.0 创建Maven项目 Pom.xml编写

Hadoop Linux Java 大数据 2025-11-12

大数据 | IndexPython（大数据）未读

大数据 | 数据清洗（pd第五套）

import pandas as pd import numpy as np import os p = os.getcwd() print(p) src_file = f"{p}/src/distribution.csv" srcdf = pd.read_csv(src_file) sums =

2025-11-04

大数据 | IndexLinux 未读

大数据 | Hadoop 搭建

本文转载自 QingYingX's Blog：原文地址关闭防火墙&SELinux 防火墙 systemctl status firewalld 查看防火墙状态 systemctl stop firewalld 关闭防火墙 systemctl disable firewalld

Hadoop Linux 大数据 Java 2025-10-30

大数据 | IndexCCFPython（大数据）未读

CCF | Gradio智能体搭建

示例代码 import gradio as gr import requests, json url = "http://172.16.115.91:11434/api/generate" def main(prompt, history): advisor_data = {

大数据 | IndexCCFPython（大数据）未读

CCF | 数据标注

示例代码 import csv import random import pandas as pd import numpy as np china_regions = { "华北地区": { "北京市": ["朝阳区", "海淀区", "西城区", "东城区", "丰台

CCF Python 大数据 2025-10-30

大数据 | IndexCCFPython（大数据）未读

CCF | 数据去重

示例代码 import csv import pandas as pd import numpy as np csv_file = "data.csv" df = pd.read_csv(csv_file) df_no_duplicated = df.drop_duplicates(

CCF Python 大数据 2025-10-30

大数据 | IndexCCFPython（大数据）未读

CCF | 可视化-词云图

示例代码 import pandas as pd import numpy as np from pyecharts import options as opts from pyecharts.charts import WordCloud inputfile = "data_m2_t1_s2.

CCF Python 大数据可视化 2025-10-30

CCF大数据 | IndexPython（大数据）未读

CCF | 可视化-中国地图

示例代码 import pandas as pd import numpy as np from pyecharts import options as opts from pyecharts.charts import Map inputfile = "data_m2_t1_s2.csv" ou

CCF Python 大数据可视化 2025-10-30