數據處理的基本目的是從大量的、可能是雜亂無(wú)章的、難以理解的數據中抽取并推導出對于某些特定的人們來(lái)說(shuō)是有價(jià)值、有意義的數據。
數據處理對數據(包括數值的和非數值的)進(jìn)行分析和加工的技術(shù)過(guò)程。包括對各種原始數據的分析、整理、計算、編輯等的加工和處理。比數據分析含義廣。隨著(zhù)計算機的日益普及,在計算機應用領(lǐng)域中,數值計算所占比重很小,通過(guò)計算機數據處理進(jìn)行信息管理已成為主要的應用。
如測繪制圖管理、倉庫管理、財會(huì )管理、交通運輸管理,技術(shù)情報管理、辦公室自動(dòng)化等。在地理數據方面既有大量自然環(huán)境數據(土地、水、氣候、生物等各類(lèi)資源數據),也有大量社會(huì )經(jīng)濟數據(人口、交通、工農業(yè)等),常要求進(jìn)行綜合性數據處理。
擴展資料:
數據處理的基本方式:
根據處理設備的結構方式、工作方式,以及數據的時(shí)間空間分布方式的不同,數據處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點(diǎn),應當根據應用問(wèn)題的實(shí)際環(huán)境選擇合適的處理方式。
數據處理主要有四種分類(lèi)方式:
1、根據處理設備的結構方式區分,有聯(lián)機處理方式和脫機處理方式。
2、根據數據處理時(shí)間的分配方式區分,有批處理方式、分時(shí)處理方式和實(shí)時(shí)處理方式。
3、根據數據處理空間的分布方式區分,有集中式處理方式和分布處理方式。
4、根據計算機中央處理器的工作方式區分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。
參考資料來(lái)源:百度百科-數據處理
一、線(xiàn)路交換
所謂線(xiàn)路交換是通過(guò)網(wǎng)絡(luò )中的節點(diǎn)在兩個(gè)站之間建立一條專(zhuān)用的通訊線(xiàn)路。如圖1的電話(huà)系統,這種線(xiàn)路交換系統,在兩個(gè)站之間有一個(gè)實(shí)際的物理連接,這種連接是節點(diǎn)之間的連接序列。在傳輸任何數據之間都必須建立點(diǎn)到點(diǎn)的線(xiàn)路。如站1發(fā)送一個(gè)請求到節點(diǎn)2,請求與站點(diǎn)2建立一個(gè)連接,那么站點(diǎn)1到節點(diǎn)1是一條專(zhuān)用線(xiàn)路。在交換機上分配一個(gè)專(zhuān)用的通道連接到節點(diǎn)2再到站點(diǎn)2的通訊。至此就建立了一條從站點(diǎn)1經(jīng)過(guò)節點(diǎn)2再到站點(diǎn)2的通訊物理通道。這樣就可以將話(huà)音從站點(diǎn)1傳送到站點(diǎn)2了,一般來(lái)說(shuō)這種連接是全雙工的,可以在兩個(gè)方向傳輸話(huà)音(數據)。
二、報文交換
這種交換方式不需要在兩個(gè)站點(diǎn)之間建立一條專(zhuān)用通路,如果一個(gè)站想要向站點(diǎn)2發(fā)送一個(gè)報文(信息的一個(gè)邏輯單位),它把站點(diǎn)2的地址(編碼方式,叫做地址碼)附加在要發(fā)送的報文上。然后把報文通過(guò)網(wǎng)絡(luò )從節點(diǎn)到節點(diǎn)進(jìn)行發(fā)送,在每個(gè)節點(diǎn)中(如要通過(guò)多個(gè)節點(diǎn)才能發(fā)送到站點(diǎn)2)完整地接收整個(gè)報文且暫存這個(gè)報文,然后再發(fā)送到下一個(gè)節點(diǎn)。在交換網(wǎng)中,每個(gè)節點(diǎn)是一個(gè)電子或機電結合的交換設備,每個(gè)節點(diǎn)通常是一臺通用的小型計算機。它具有足夠的存儲容量來(lái)緩存進(jìn)入的報文。一個(gè)報文在每個(gè)節點(diǎn)的延遲時(shí)間等于接收報文的所有位所需要的時(shí)間,加上等待時(shí)間和重傳到下一節點(diǎn)所需要的排隊延時(shí)時(shí)間。
報文交換有以下優(yōu)點(diǎn)
1、線(xiàn)路效率較高,這是因為許多報文可以用分時(shí)方式共享一條節點(diǎn)到節點(diǎn)的通道。
2、不需要同時(shí)使用發(fā)送器和接收器來(lái)傳輸數據,網(wǎng)絡(luò )可以在接收器可用之前暫時(shí)存儲這個(gè)報文。
3、在線(xiàn)路交換網(wǎng)上,當通訊量變得很大時(shí),就不能接受某些呼叫。而在報文交換上卻仍然可以接收報文,只是傳送延遲會(huì )增加。
4、報文交換系統可以把一個(gè)報文發(fā)送到多個(gè)目的地。
5、能夠建立報文的優(yōu)先權。
6、報文交換網(wǎng)可以進(jìn)行速度和代碼的轉換,因為每個(gè)站都可以用它特有的數據傳輸率連接到其他點(diǎn),所以?xún)蓚€(gè)不同傳輸率的站也可以連接,另外還可以轉換傳輸數據的格式。
三、分組交換
分組交換方式兼有報文交換和線(xiàn)路交換的優(yōu)點(diǎn)。其形式上非常像報文交換。主要差別在于分組交換網(wǎng)中要限制傳輸的數據單位長(cháng)度,一般在報文交換系統中可傳送的報文數據位數可做得很長(cháng),而在分組交換中,傳送報文的最大長(cháng)度是有限制的,如超出某一長(cháng)度,報文必須要分割成較少的單位,然后依次發(fā)送,我們通常稱(chēng)這些較少的數據單位為分組。這就是報文交換與分組交換所不同之處。
變量變換也稱(chēng)變量代換,是將原數據X轉換成它的某種函數值如lgX,X1/2等,其目的是使變換后的數據達到某種要求。例如運用方差分析作多個(gè)均數間的比較時(shí),要求各樣本所來(lái)自的總體分布是正態(tài)的,方差是相同的,以及處理的效應是可加的。如果樣本所來(lái)自的總體偏離這三個(gè)條件太遠,方法之一是進(jìn)行變量變換,使之達到上述要求。又如求曲線(xiàn)回歸方程時(shí),常作變量變換,使之達到直線(xiàn)化的要求。此外,在計算過(guò)程中,常用變量變換達到簡(jiǎn)化運算的要求等等。應該指出的是,根據變換值進(jìn)行統計分析,常用以說(shuō)明原數據的信息,而且常需還原成原數據的單位。運用方差分析時(shí),總體的非正態(tài)性、方差的非齊性和效應的不可加性這三者常常一起發(fā)生,往往經(jīng)過(guò)某種變量變換改正其中之一時(shí),可使其余兩者亦有所改善。
變量變換的常用方法有對數變換、平方根變換、平方根反正弦變換、概率單位變換、logit變換、反雙曲正切變換、倒數變換、乘方變換等。方法的選擇要根據變換的目的和原數據的性質(zhì)、分布特征,特別是變換后的效果。當變換所得數值仍未達到預期的要求時(shí),應具體分析其原因,再按照資料的性質(zhì)用不同的變換方法嘗試,但不要盲目亂試。
科技成果轉化主要有五種方式:①自行投資實(shí)施轉化;②向他 人轉讓科技成果;③許可他人使用科技成果;④以科技成果作為合作條件,與他人共同實(shí)施轉化;⑤以該科技成果作價(jià)投資,折算股份或者出資 比例。
其中,第一種方式屬于科技成果持有人自行轉化,即高等院校、科研 院所或企業(yè)等主體將其研發(fā)的科技成果應用于本單位的生產(chǎn)活動(dòng),此方 式的特點(diǎn)是沒(méi)有中間環(huán)節,降低了成果轉化的交易成本,但僅適合于研發(fā) 生產(chǎn)鏈條較為完善的主體。第二、第三種方式屬于轉移式轉化,即科技成 果持有人通過(guò)許可、轉讓的方式將科技成果的使用權或所有權轉移給技 術(shù)需求方,此方式是髙等院校、科研院所實(shí)現科技成果轉化的主要方式。
第四、第五種方式屬于合作轉化方式,此方式有利于產(chǎn)、學(xué)、研單位以技術(shù) 為紐帶形成利益共享、風(fēng)險共擔的合作機制。
② 數據分析為了挖掘更多的問(wèn)題,并找到原因;③ 不能為了做數據分析而坐數據分析。
2、步驟:① 調查研究:收集、分析、挖掘數據② 圖表分析:分析、挖掘的結果做成圖表3、常用方法: 利用數據挖掘進(jìn)行數據分析常用的方法主要有分類(lèi)、回歸分析、聚類(lèi)、關(guān)聯(lián)規則、特征、變化和偏差分析、Web頁(yè)挖掘等,它們分別從不同的角度對數據進(jìn)行挖掘。 ①分類(lèi)。
分類(lèi)是找出數據庫中一組數據對象的共同特點(diǎn)并按照分類(lèi)模式將其劃分為不同的類(lèi),其目的是通過(guò)分類(lèi)模型,將數據庫中的數據項映射到某個(gè)給定的類(lèi)別。它可以應用到客戶(hù)的分類(lèi)、客戶(hù)的屬性和特征分析、客戶(hù)滿(mǎn)意度分析、客戶(hù)的購買(mǎi)趨勢預測等,如一個(gè)汽車(chē)零售商將客戶(hù)按照對汽車(chē)的喜好劃分成不同的類(lèi),這樣營(yíng)銷(xiāo)人員就可以將新型汽車(chē)的廣告手冊直接郵寄到有這種喜好的客戶(hù)手中,從而大大增加了商業(yè)機會(huì )。
②回歸分析。回歸分析方法反映的是事務(wù)數據庫中屬性值在時(shí)間上的特征,產(chǎn)生一個(gè)將數據項映射到一個(gè)實(shí)值預測變量的函數,發(fā)現變量或屬性間的依賴(lài)關(guān)系,其主要研究問(wèn)題包括數據序列的趨勢特征、數據序列的預測以及數據間的相關(guān)關(guān)系等。
它可以應用到市場(chǎng)營(yíng)銷(xiāo)的各個(gè)方面,如客戶(hù)尋求、保持和預防客戶(hù)流失活動(dòng)、產(chǎn)品生命周期分析、銷(xiāo)售趨勢預測及有針對性的促銷(xiāo)活動(dòng)等。 ③聚類(lèi)。
聚類(lèi)分析是把一組數據按照相似性和差異性分為幾個(gè)類(lèi)別,其目的是使得屬于同一類(lèi)別的數據間的相似性盡可能大,不同類(lèi)別中的數據間的相似性盡可能小。它可以應用到客戶(hù)群體的分類(lèi)、客戶(hù)背景分析、客戶(hù)購買(mǎi)趨勢預測、市場(chǎng)的細分等。
④關(guān)聯(lián)規則。關(guān)聯(lián)規則是描述數據庫中數據項之間所存在的關(guān)系的規則,即根據一個(gè)事務(wù)中某些項的出現可導出另一些項在同一事務(wù)中也出現,即隱藏在數據間的關(guān)聯(lián)或相互關(guān)系。
在客戶(hù)關(guān)系管理中,通過(guò)對企業(yè)的客戶(hù)數據庫里的大量數據進(jìn)行挖掘,可以從大量的記錄中發(fā)現有趣的關(guān)聯(lián)關(guān)系,找出影響市場(chǎng)營(yíng)銷(xiāo)效果的關(guān)鍵因素,為產(chǎn)品定位、定價(jià)與定制客戶(hù)群,客戶(hù)尋求、細分與保持,市場(chǎng)營(yíng)銷(xiāo)與推銷(xiāo),營(yíng)銷(xiāo)風(fēng)險評估和詐騙預測等決策支持提供參考依據。 ⑤特征。
特征分析是從數據庫中的一組數據中提取出關(guān)于這些數據的特征式,這些特征式表達了該數據集的總體特征。如營(yíng)銷(xiāo)人員通過(guò)對客戶(hù)流失因素的特征提取,可以得到導致客戶(hù)流失的一系列原因和主要特征,利用這些特征可以有效地預防客戶(hù)的流失。
⑥變化和偏差分析。偏差包括很大一類(lèi)潛在有趣的知識,如分類(lèi)中的反常實(shí)例,模式的例外,觀(guān)察結果對期望的偏差等,其目的是尋找觀(guān)察結果與參照量之間有意義的差別。
在企業(yè)危機管理及其預警中,管理者更感興趣的是那些意外規則。意外規則的挖掘可以應用到各種異常信息的發(fā)現、分析、識別、評價(jià)和預警等方面。
⑦Web頁(yè)挖掘。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:2.990秒