Hadoop综合大作业-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Hadoop综合大作业

阅读量：6072 次

发布时间：2019-06-20

本文共 258 字，大约阅读时间需要 1 分钟。

1.用Hive对爬虫大作业产生的文本文件（或者英文词频统计下载的英文长篇小说）进行词频统计。

启动hadoop：

上传到wc文件中

启动Hive

在hive数据库创建表 world：

导入文本test.txt并查看

用HQL进行词频统计

2.用Hive对爬虫大作业产生的csv文件进行数据分析，写一篇博客描述你的分析过程和分析结果。

创建用于存放csv数据目录

把文件放入文件夹中

查看文件中的数据：

导入数据库表中

转载于:https://www.cnblogs.com/605-mk/p/9089040.html

你可能感兴趣的文章

【框架整合】Maven-SpringMVC3.X+Spring3.X+MyBatis3-日志、JSON解析、表关联查询等均已配置好...

要想成为高级Java程序员需要具备哪些知识呢？

带着问题去学习--Nginx配置解析(一)

onix-文件系统

java.io.Serializable浅析

我的友情链接

多线程之线程池任务管理通用模板

CSS3让长单词与URL地址自动换行——word-wrap属性

CodeForces 580B Kefa and Company

开发规范浅谈

Spark Streaming揭秘 Day29 深入理解Spark2.x中的Structured Streaming

鼠标增强软件StrokeIt使用方法

本地连接linux虚拟机的方法

某公司面试java试题之【二】，看看吧，说不定就是你将要做的题

BABOK －企业分析（Enterprise Analysis）概要

Linux 配置vnc，开启linux远程桌面

NLog文章系列——如何优化日志性能

Hadoop安装测试简单记录

CentOS6.4关闭触控板

ThreadPoolExecutor线程池运行机制分析-线程复用原理

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-04 07:31:24 当前IP: 13.59.69.58 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我