也是时候开始了。
“当然,大数据其实始终贯穿着人类的历史,从古至今的各法例都能看到大数据的踪迹。”
苏小木简单的答,“说不好,我觉得大数据无非就是多维分析,最终针对的还是人。”
======
张可教授要听的肯定不是网络上的那些烂而化之的回答。
2更。
从生活中、从学习中、从自经历的方方面面
行总结归纳并给
答案……
这些技术包括大规模并行理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
“这样一来,专业针对的就是课题本的算法、主导数据与行为模型。”
苏小木的话是有理的,当然也是有私心的……
hadp框架最心的设计就两
,hdfs和apredue。
张可。
“件层面的准备基本完善,但
件层面的
署还得我们亲自来,首先是分布式文件系统,我们讨论一
,是否直接使用hadp实现的分布式文件系统:hdfs?”
ib也曾提了大数据的特
:大量、
速、多样、低价值密度、真实
。
一般看来,大数据指无法在一定时间范围用常规
件工
行捕捉、
理和
理的数据集合。
谭凌开,“我认为大数据就是数量庞大的任意数据,甚至这些数据本
并没有什么卵用,而且还没什么价值,扔之可惜。”
而是他们每一个人自己的总结。
独剩苏小木沉默不语。
本章已阅读完毕(请击
一章继续阅读!)
“小木同学,你来说说?”张可了名。
但,大家都不会简单的从这些概念上的东西来行回答。
包括hadp,完全就是为了大数据而开发的程序。
张可的问题引发了课题实验组每个成员的意见发表。
没等大家开,张可问
,“你们觉得,什么是大数据?”
“每个人都有每个人对大数据的理解,我们的课题只是从大数据发,探索主导数据、行为模型的一个片段。”
苏小木试图争取了一,“教授,如果我们课题的时间足够
的话,不如我们试试自己实现,不借用hadp,重新设计分布式文件系统、并行运算算法、并行
理数据库这些。”
也不知林唐是不是最近看柯南看多了,张
就是连环案件。
不过大家都有意无意的看了苏小木,心里都明白张可有很大概率是为了等苏小木完成a总决赛。
“大家可以通过课题,去找到每个人对大数据的新理解。”
这个问题问后,苏小木、谭凌、林唐等人都陷
了沉思。
这个大课题拖的时间了。
是需要新理模式才能
有更
的决策力、
察发现力和
程优化能力的海量、
增
率和多样化的信息资产。
hdfs为海量数据提供了存储方式,apredue为海量数据提供了计算。
同时大数据还需要特殊的技术,来有效理大量的容忍经过时间
的数据。
良久。
“比如连环案件分析?”林唐嘴
。
首先hdfs基本上是个通用的大数据分布式文件系统,最重要的一是设计就是用来
署在低廉
件上的。
。
从技术上看,大数据与云计算的关系就像一枚币的正反面一样密不可分,必须采用分布式架构,必须依托云计算的分布式
理、分布式数据库和云存储、虚拟化技术。
其他几人各有回答。