ប្រព័ន្ធវិភាគទិន្នន័យ គឺជាសហគមន៍រួមរវាងមនុស្ស និងម៉ាស៊ីន:
- ម៉ាស៊ីនទទួលខុសត្រូវក្នុងការប្រមូលទិន្នន័យ
- ម៉ាស៊ីនទទួលខុសត្រូវក្នុងការរៀបចំ និងដំណើរការទិន្នន័យជាមុន (pre-processing)
- ម៉ាស៊ីនបង្ហាញលទ្ធផលការងារក្នុងទម្រង់ដែលមនុស្សអាចយល់បានយ៉ាងងាយស្រួល
- មនុស្ស ដោយផ្អែកលើការងារដែលម៉ាស៊ីនបានធ្វើ នឹងធ្វើការសន្និដ្ឋានលើទិន្នន័យ
ដូច្នេះ ប្រសិនបើយើងមើលការងារវិភាគទិន្នន័យជាបំពង់មួយ នោះយ៉ាងហោចណាស់មានពីរផ្នែក:
- ផ្នែកម៉ាស៊ីន:លទ្ធផលចុងក្រោយគឺជាតារាង/ក្រាបដែលមនុស្សអាចដំណើរការបាន1
- ផ្នែកមនុស្ស:លទ្ធផលចុងក្រោយគឺជាសេចក្តីសន្និដ្ឋានលើទិន្នន័យ
សរុបមក សម្រាប់អ្នកសរសេរកម្មវិធី ភារកិច្ចសំខាន់បំផុតនៃការវិភាគទិន្នន័យ គឺធ្វើឲ្យទិន្នន័យអាចមើលឃើញបាន2។
-
“មនុស្សអាចដំណើរការបាន” មិនមែនមានន័យថា “មនុស្សអាចកំណត់ស្គាល់បាន” ទេ។ ព្រោះទិន្នន័យរាប់រយTBភាគច្រើនជាតែខ្លឹមសារអត្ថបទ មនុស្សក៏អាចស្គាល់បានដែរ ប៉ុន្តែបរិមាណទិន្នន័យលើសសមត្ថភាពដំណើរការរបស់មនុស្ស។ ដូចนั้น ទោះបីមនុស្សអាចស្គាល់បានក៏ដោយ ក៏មនុស្សមិនអាចដំណើរការបាន។ ដើម្បីឲ្យមនុស្សអាចដំណើរការបាន ត្រូវសរុប/បង្រួមទិន្នន័យ ឲ្យទម្រង់ទិន្នន័យអាចស្គាល់បានដោយមនុស្ស ហើយបរិមាណមិនធំពេក។ ដោយគិតពីអត្ថប្រយោជន៍ខ្លាំងរបស់មនុស្សក្នុងការចាប់រូបភាព សម្រួលទិន្នន័យឲ្យទៅជាទម្រង់រូបភាព គឺអាចធ្វើឲ្យបង្ហាញបរិមាណព័ត៌មានបានច្រើនបំផុត។ ↩
-
ប្រហែលជានេះក៏ជាមូលហេតុមួយដែលធ្វើឲ្យភាសា R ហាក់ដូចជាមានសារៈសំខាន់ណាស់ដែរ។ ↩