Spark从入门到精通19：Spark实战案例之统计网站访问量 - 物流园资讯移动站

相关文章

Spark从入门到精通19：Spark实战案例之统计网站访问量

2024-11-09 20:36

本节来介绍Spark实战案例：通过分析网站的访问日志，来求出网站中访问量最高的两个页面。

Spark从入门到精通19：Spark实战案例之统计网站访问量

access_log.txt 提取码：xxjc

本节用到的日志文件格式如下所示：

192.168.88.1 - - [30/Jul/2017:12:54:52 +0800] "GET /MyDemoWeb/hadoop.jsp HTTP/1.1" 200 242 192.168.88.1 - - [30/Jul/2017:12:54:53 +0800] "GET /MyDemoWeb/oracle.jsp HTTP/1.1" 200 242 192.168.88.1 - - [30/Jul/2017:12:54:54 +0800] "GET /MyDemoWeb/mysql.jsp HTTP/1.1" 200 241

使用WinSCP工具将$SPARK_HOME/jars目录下的所有Jar包下载到本地目录如E:/sparklib中。

打开IDEA开发工具，选择“Create New Project”，选择Scala下面的sbt工程，Next
工程名字：WebAccessCount，选择一个保存位置，比如：E:/WebAccessCount，Java版本和Scala版本需要和Spark集群环境中的保持一致，sbt版本保持默认，Finish
在WebAccessCount工程上右键单击，New，Directory，输入目录名：lib，OK
将刚才下载好的所有Jar包，复制粘贴到lib文件夹，在弹出的确认对话框中单击OK
选中lib目录下的所有的Jar包，右键，选中“Add as Libirary”，在弹出的对话框中输入库的名字，比如：spark_jars，OK

注意：IDEA构建工程的过程比较慢，请耐心等待。只有等工程构建完成后，工程的结构才会完整，写代码时才会有智能提示。可以通过更改sbt源的方式来提高构建速度，这里不作介绍。

在WebAccessCount工程下的src/main/scala目录上右键，New，Package：demo，OK
在demo下面New，Scala Class：WebAccessCount.scala，种类选择：Object，OK
编写WebAccessCount.scala代码如下：

以上就是本篇文章【Spark从入门到精通19：Spark实战案例之统计网站访问量】的全部内容了，欢迎阅览！文章地址：http://fhzcwj.xhstdz.com/news/643.html
栏目首页相关文章动态同类文章热门文章网站地图返回首页物流园资讯移动站 http://fhzcwj.xhstdz.com/mobile/ , 查看更多

最新文章

做seo为什么要从白帽seo做起

本人十三君跟着师父十二君做seo也有些时间了，从接触seo以来，发现一个有趣的现象：很多做seo的人员，尤其是新人总想着玩黑帽与

企业工信部备案提交教程（电子化备案）

一、教程目的本教程主要针对首次备案过程中所需基本信息的填写说明。（非经营性网站：只要是通过第三方支付࿰

伊金霍洛网站排名优化费用是如何计算的？

伊金霍洛网站seo优化百度搜索引擎关键词快速排名推广提升自然流量点击SEO优化师、网站设计师、梦想者您的流量获取专家“创新互联

【R9s（全网通）搜狗手机输入法下载】OPPO R9s 全网通搜狗手机输入法12.1.1免费下载

搜狗输入法，拥有超大中文词库，输入更加精准，智能。搜狗智能旺仔带你用表达，斗图，妙语，输入更加有趣。******特色功能******

57、曾正忠三部曲《变化球 Breaking Ball》《迟来的决战 The Last Battle》《无胆狗雄 TATAMI》

水平有限，还望轻喷。＼＼\ ( 'ω' ) //／／相较去年，重心从挑选top10变成了尽量多列举一些作品，所以今年提及的漫画数量比较

微信公众号及服务号文章爬取

使用Python爬取公众号文章主要两种方法：通过爬取第三方公众号聚合网站通过微信公众平台引用文章接口微信传送门已被封杀，现存可

人工智能板块震荡：投资者应关注AI ETF与软件ETF动态

随着科技的不断发展，人工智能（AI）领域的投资持续引发市场的关注。根据最新市场数据，截至今日收盘，中证人工智能主题指数上涨

男科专题：宁波市男科医院排名更新,宁波普仁男科医院怎么样

男科专题：宁波市男科医院排名更新,宁波普仁男科医院怎么样？男科疾病常常困扰着男性的生活与工作，影响着他们的身心健康。因此

品牌升级前必须思考的5个关键问题

重塑品牌事关重大，改变现有的品牌名称或形象可能会非常冒险。但同时，品牌形象升级也可能恰恰是治愈品牌病痛的不二良方。当企业

城口SEO优化神器，企业线上崛起的利器揭秘

城口SEO优化推广软件，为企业线上崛起提供强劲助力。通过精准关键词优化、网站结构优化等手段，提升网站在搜索引擎排名，吸引潜

相关文章

相关动态

seo-短视频网页入口引流：快速提升网站流量的秘诀

北京微信朋友圈广告的收费方式，朋友圈广告投放运营

如何快速提升网站排名

企业为何要重视SEO优化而非仅依赖广告？这两个问题你真的清楚吗？

E4A影视APP源码电视盒子酷点TV版4.5 后端对接苹果cms

python爬取王者_教你用Python爬取手机APP数据！以王者荣耀的数据信息为例

12月10日沪市A股主力资金流向个股排名

全网营销推广优化秘籍，揭秘高效策略与平台技巧

新品牌宣传策划方案出炉！如何高效推广品牌？

史上“最火爆”春节假期：“寻找年味”成为旅游市场关键词