“大数据”时代背景下计算机信息处理技术研究
第三次科技革命当中, 最具有代表性的科技产物就在于计算机, 当下的计算机系统的运算速度达到每秒万亿次, 微机也能达到每秒几亿次, 能够解决大量的复杂计算问题。正因为此, 大数据技术要成行, 计算机信息处理技术是关键。
一、大数据与计算机信息技术
大数据又叫巨量数据, 在目前大数据是一个急需开发的矿山, 蕴含着非常丰富的资源, 但是必须要注意的是大数据要开发出来才具备应有的价值, 否则就是一堆毫无意义的数据。针对大数据应用, 开发者头疼的问题在于不好把握功率、覆盖范围、传输速率及成本之间的平衡点, 通过大数据分析, 企业可以降低成本、提高效率以及方便决策制定等。而要实现大数据应用, 计算机信息技术是必备的前提条件, 大数据的采集、存储、分析、挖掘都离不开计算机。特别是大数据分析, 需要具备强大的运算能力, 人力根本无法在短时间内完成巨量数据的处理。
二、计算机信息处理技术
对于大数据来说, 计算机信息处理技术是非常重要的前提, 从大数据的角度来说, 计算机信息处理技术, 主要涵盖如下几个方面的内容:
(一) 信息采集
计算机要处理信息必须是先采集信息, 对于大数据来说同样如此。信息采集在计算机信息处理技术当中是非常基础的内容。计算机通过对信息源的实时监督与控制, 并将采集到的信息在计算机数据库中存储, 为计算机软件提供数据支撑。当然大数据应用中数据的采集, 并非单纯依靠普通计算机, 而主要是依靠网络计算机, 换而言之就是大数据应用中的数据主要来自处于网络节点的服务器, 一般来说, 网络计算机可以采集、存储、处理网络上80%的数据。
(二) 信息存储
计算机的信息存储功能为计算机信息采集提供了极大的便利, 计算机通过数据库存储采集到的信息, 这给计算机用户调用数据提供了便利, 用户直接通过数据库就可以查阅相关的数据信息。一般来说, 数据库当中的数据信息时可以永久保留的, 特别是在分布式存储技术 (可扩展的分布式文件系统是一个代表性技术) 出现以后, 数据库可以永久保留巨量的信息数据, 这为大数据应用中数据的挖掘提供了极大便利。
(三) 数据索引
在计算机数据库当中有一个非常重要的功能即数据索引。比方说BIGTABLE技术 (谷歌) 是分布式数据存储系统, 用来处理海量的数据的一种非关系型数据库, 是一个稀疏的、分布式的、持久化存储的多维度排序Map, 能够进行可靠的PB级数据存储, 并能够在上千台机器上进行部署。基于此技术的研究热点在于互补式聚簇和聚簇索引。
(四) 数据挖掘
网络搜索和实体关联分析为基于内容信息的数据挖掘提供便利, 当下互联网以排序学习算法为研究热点, 这种算法针对社会媒体的信息量及关注数据的特点为短文本特征, 比较常见的是逐点、逐对及逐列。比方说MBR (Memory-Based Reasoning) 这种方法就是利用已知case (案例) 来预测未来case的一些attribute (属性) , 并一般寻找最为相似的案例来比较。
从世界范围来看, 数据挖掘技术已经十分成熟, 对于一个企业, 如果云平台架构能力强, 能够将获取的数据实时传递到云端, 再从云端向用户群体推送, 这可以说是大数据时代下企业的新一种核心竞争力。神经网络揭示的是计算机的自学习和自适应, 被广泛用于机器学习、物流选址、测井解释、信号处理等方面。同时也是进行分布式信息处理的数学模型。
当然大数据中数据挖掘的主要应用方向在于分类与聚类分析。通过归类数据点, 进而确定新的数据点就是分类分析, 在客观结构和假设明确的前提下, 对客户行为进行预测。而没有明确限制因素情况下, 对数据进行整合并划分为多个对象组, 然后对对象组进行分析, 这就是聚类分析。不过就目前来说, 大数据时代背景下, 计算机信息处理技术当中的数据挖掘, 还有关联规则和机器学习两个方面的内容, 关联规则就是在处理数据的过程当中找到其中的关联规则, 而将计算机用于模拟人类的学习行为, 并将已有的知识体系进行重组, 就是机器学习。其中机器学习是人工智能技术当中的核心内容。
(五) 数据分析
就数据分析来说, 包括网络、空间、情感、回归、时域序列分析。而可视化就是利用计算机的可视化OS对数据进行分析处理。
(六) 信息安全
信息安全是计算机信息处理技术当中非常重要的一环。尤其是在大数据时代下, 随着大数据应用的不断深入, 人们的个人信息正在飞速的丧失隐秘性, 变成了具有共享性的关联数据, 这些信息并不一定会带来积极的效果, 甚至可能产生反效果。同时信息的修改, 势必会影响到与之关联的其他信息, 而这一过程就会暴露出一些安全隐患。所以如何保证信息安全则是在追求计算机信息处理技术进步的过程中必须要着重研究的内容。
三、计算机信息处理技术的发展
大数据时代背景下, 计算机信息处理技术是非常关键的一环, 就目前的形势来看, 计算机信息处理技术主要在向着人工技能的方向上发展。大数据应用当中, 人工智能是非常高级的一个阶段, 大数据的语义引擎发展到最后, 必然需要人工智能的介入, 以便提高数据分析的效率。
当然要实现人工智能, 人工神经网络是必须经历的一个阶段。大量的神经元 (节点) 组成神经网络, 每个节点代表一个激励函数, 每两个节点间的连接都代表一个权重, 相当于神经网络的记忆, 网络的输出由连接方式、权重值和激励函数决定, 通过模拟人脑神经网络处理、记忆信息的方式进行信息处理。
四、结束语
综上所述, 在大数据时代背景下, 随着大数据的应用深入, 计算机信息处理技术随之进行更新换代, 并逐渐向着人工智能的反向靠拢。为此本文结合大数据的相关应用, 研究了计算机信息处理技术, 可能存在不足, 但希望有一定参考价值。
摘要:计算机信息处理技术在一定程度上可以说是大数据应用的基础条件, 在大数据应用逐渐深入的时代背景下, 研究计算机信息处理技术具有非常显著的现实意义。
关键词:大数据,计算机,信息处理
参考文献
[1] 陈应权.数据时代的网络信息处理技术探析[J].无线互联科技, 2013, 05:29.
[2] 陈成业.关于大数据与计算机信息处理技术的发展辨析[J].信息系统工程, 2016, 05:27.