ຂໍ້ມູນໃຫຍ່ທຽບກັບສາງຂໍ້ມູນ. ຄວາມແຕກຕ່າງແມ່ນຫຍັງ?

ເຕັກໂນໂລຢີກ້າວ ໜ້າ ໃນຈັງຫວະທີ່ບໍ່ສາມາດຕິດຕາມໄດ້, ແລະຜູ້ບໍລິຫານດ້ານເຕັກໂນໂລຢີຜູ້ສູງອາຍຸໃນໄວໆນີ້ຈະພົບວ່າຊັ້ນຮຽນເຕັກໂນໂລຢີທີ່ຈົບປະລິນຍາຕີທັງ ໝົດ ລ້ວນແຕ່ກາຍເປັນຄົນລ້າສະ ໄໝ. ຖ້າທ່ານເປັນຫົວ ໜ້າ ຝ່າຍເຕັກໂນໂລຢີ (CTO) ທີ່ບໍລິສັດໃຫຍ່, ທ່ານບໍ່ມີເວລາຫຼາຍທີ່ຈະຮຽນຮູ້ເຕັກໂນໂລຢີ ໃໝ່ ເພາະວ່າທ່ານຫຍຸ້ງເກີນໄປໃນການຕໍ່ສູ້ກັບໄຟ ໄໝ້ ແລະເຮັດໃຫ້ແນ່ໃຈວ່າທ່ານເບິ່ງດີໃນກອງປະຊຸມສະພາຄັ້ງຕໍ່ໄປ. ກ່ອນ ໜ້າ ຄົນອື່ນຜູ້ທີ່ພະຍາຍາມເຮັດສິ່ງດຽວກັນ. ໃນບາງເວລາ, ທ່ານອາດຈະເຫັນຕົວເອງຖາມວ່າ: ຂໍ້ມູນໃຫຍ່ທຽບກັບຄັງຂໍ້ມູນແຕກຕ່າງກັນແນວໃດ?

ຜູ້ຊ່ຽວຊານດ້ານເຕັກໂນໂລຢີໃດກໍ່ຈະຄຸ້ນເຄີຍກັບຖານຂໍ້ມູນ. ມັນເປັນການລວບລວມຂໍ້ມູນທີ່ເຕີບໃຫຍ່ຕາມການເວລາແລະສິ່ງທີ່ທ່ານໄດ້ຮຽນຮູ້ສິ່ງທີ່ ໜ້າ ສົນໃຈຈາກການສອບຖາມ. ຫຼັງຈາກນັ້ນ, ມັນກໍ່ມີແນວຄິດກ່ຽວກັບສາງຂໍ້ມູນເຊິ່ງມັນແມ່ນສິ່ງທີ່ຊື່. ຢ່າເຂົ້າໄປໃນການສົນທະນາທັງ ໝົດ“ Kimball vs. Inmon” ແລະຮັກສາແບບງ່າຍໆນີ້.

ສາງຂໍ້ມູນແມ່ນ ຈຳ ນວນຂອງຖານຂໍ້ມູນທີ່ແຕກຕ່າງກັນໃນອົງກອນທີ່ສາມາດເຊື່ອມຕໍ່ໄດ້ໂດຍກຸນແຈທົ່ວໄປ. ຍົກຕົວຢ່າງ, ພວກເຮົາອາດຈະເຊື່ອມຕໍ່ບັນທຶກຕ່າງໆໃນຖານຂໍ້ມູນຫຼາຍບ່ອນໂດຍໃຊ້ສະຖານທີ່ທີ່ມີເອກະລັກເອີ້ນວ່າ CUSTOMER_ID. ນີ້ແມ່ນຖານຂໍ້ມູນໃນພະແນກຕ່າງໆທີ່ບັນທຶກມີຢູ່ວ່າພວກເຮົາອາດຈະຕ້ອງການເຊື່ອມໂຍງໂດຍໃຊ້ CUSTOMER_ID:

ໂດຍໃຊ້ CUSTOMER_ID, ທ່ານສາມາດພິມອອກໃນ ໜ້າ ດຽວ, ບັນຊີຂອງໃບແຈ້ງ ໜີ້ ທັງ ໝົດ ທີ່ຍັງບໍ່ທັນໄດ້ຈ່າຍແລະບັນຊີຂອງ 10 ຄຳ ຮ້ອງຂໍການບໍລິການຫຼ້າສຸດທີ່ຜູ້ຂາຍສາມາດ ນຳ ໄປປະຊຸມກັບພວກເຂົາໄດ້. ແນ່ນອນ, ມື້ນີ້ພວກເຮົາພຽງແຕ່ ນຳ ໃຊ້ Salesforce ສຳ ລັບທຸກໆສິ່ງນີ້, ແຕ່ຕົວຢ່າງທີ່ງ່າຍໆນີ້ໃຫ້ທ່ານຮູ້ວ່າມັນມີປະໂຫຍດແນວໃດໃນການເຊື່ອມຕໍ່ແຫລ່ງຂໍ້ມູນທີ່ແຕກຕ່າງກັນ. ນັ້ນແມ່ນສິ່ງທີ່ສາງຂໍ້ມູນທັງ ໝົດ ກ່ຽວກັບ, ຍົກເວັ້ນພວກເຂົາເອົາບາດກ້າວຕໍ່ໄປແລະໃຊ້ຂໍ້ມູນທີ່ເຊື່ອມຕໍ່ກັນເພື່ອຕັດສິນໃຈໃນລະດັບສູງ. ເມື່ອສ້າງສາງຂໍ້ມູນ, ທ່ານມັກຈະຮູ້ ຄຳ ຖາມໃດທີ່ທ່ານອາດຈະຕ້ອງການຕອບເພາະວ່າບາງຄົນໃນລະດັບ C ກຳ ລັງຮ້ອງຂໍເອົາຕົວຊີ້ວັດການປະຕິບັດທີ່ ສຳ ຄັນ (KPIs) ທີ່ຖືກວັດແທກ. ທ່ານບໍ່ພຽງແຕ່ໄປສ້າງຄັງຂໍ້ມູນເພື່ອເປັນປະໂຫຍດໃນການສ້າງພວກມັນເພາະມັນເປັນວຽກທີ່ລາຄາແພງ. ຕອນນີ້, ໃຫ້ເວົ້າກ່ຽວກັບ "ຂໍ້ມູນໃຫຍ່" ແລະຄັງຂໍ້ມູນ.

ສິ່ງ ທຳ ອິດທີ່ພວກເຮົາ ຈຳ ເປັນຕ້ອງ ກຳ ນົດແມ່ນ ຄຳ ວ່າ "ຂໍ້ມູນໃຫຍ່" ເຊິ່ງມັນມີຄວາມ ໝາຍ ຫຼາຍ. ທ່ານອາດຈະໄດ້ຍິນສະຖິຕິທີ່ອ້າງເຖິງເລື້ອຍໆວ່າ 98% ຂອງຂໍ້ມູນທັງ ໝົດ ຖືກສ້າງຂື້ນໃນ 2 ປີທີ່ຜ່ານມາ. ນັ້ນແມ່ນຂໍ້ມູນໃຫຍ່. ທຸກໆຊຸດຂໍ້ມູນທີ່ລ້າສຸດທີ່ ກຳ ລັງຖືກຜະລິດຢູ່ປະຈຸບັນສາມາດຂຸດຄົ້ນບໍ່ແຮ່ (ຈື່ຂໍ້ມູນການຂຸດຄົ້ນບໍ່ແຮ່?) ເພື່ອສະກັດຄວາມເຂົ້າໃຈ. ໃນໂລກທີ່ມີເຕັກໂນໂລຢີສູງໃນປະຈຸບັນ, ພວກເຮົາອາດຕ້ອງການສ້າງຄວາມເຂົ້າໃຈທີ່ພວກເຮົາບໍ່ຮູ້ວ່າມີຢູ່. ທ່ານ Donald Rumsfeld ເວົ້າຢ່າງຖືກຕ້ອງກ່ຽວກັບສິ່ງເຫຼົ່ານີ້ວ່າ "ສິ່ງທີ່ພວກເຮົາບໍ່ຮູ້", ເຊິ່ງພວກເຮົາບໍ່ຮູ້ວ່າພວກເຮົາບໍ່ຮູ້. ໃນໂລກຂອງຈິດຕະສາດ, ແນວຄິດນີ້ຖືກກ່າວເຖິງວ່າ Johari Window. ທ່ານຮູ້ຈັກຄົນໃນການຂາຍຜູ້ທີ່ບໍ່ຮູ້ເຖິງຄວາມຈິງທີ່ວ່າຄວາມເປັນຢູ່ຂອງພວກເຂົາພຽງແຕ່ເຮັດໃຫ້ທຸກຄົນທີ່ຢູ່ອ້ອມຂ້າງພວກເຂົາຕ້ອງການດຶງເປໂຕ Pan ໄປບ່ອນທີ່ສູງທີ່ສຸດທີ່ໃກ້ທີ່ສຸດ? ຄວາມຈິງທີ່ວ່າຄົນນັ້ນບໍ່ຮູ້ເຖິງຄວາມ ລຳ ຄານຂອງພວກເຂົາ - ແລະຄວາມຈິງທີ່ວ່າຄົນອ້ອມຂ້າງຄົນນັ້ນບໍ່ສາມາດເອົານິ້ວມືຂອງພວກເຂົາແນ່ນອນວ່າເປັນຫຍັງ - ແມ່ນ "ບໍ່ຮູ້ຈັກ" ໃນທີ່ບໍ່ມີໃຜຮູ້ວ່າເປັນຫຍັງ Rob ໃນການຂາຍຈຶ່ງເປັນເລື່ອງໃຫຍ່ , ໄຂມັນ, ການວິຕົກກັງວົນ. ເຖິງຢ່າງໃດກໍ່ຕາມ, ກ້າວຕໍ່ໄປ.

ລົງໃນ 7wData.be.