Data Science нь компьютерийн шинжлэх ухаан, математик болон статистик, бизнесийн (ажиллаж буй датаны тухай) мэдлэг гэсэн гурван салбарын огтлолцол юм.

Датаг цуглуулах, цэвэрлэж бэлдэх, дүн шинжилгээ хийх, таамаглал гаргаж, модел боловсруулах, гарсан үр дүнг харуулах гээд бүх үе шат Data Science-д хамаарна. Тэгвэл дата гэж юу вэ?

Дата гэдэг үг нь анх дамжуулж, хадгалж болох мэдээлэл гэсэн утгаар хэрэглэгдэж эхэлсэн бөгөөд латин хэлний “өгөгдсөн” гэдэг үгнээс үүсэлтэй. Дата нь тодорхой хугацааны туршид хадгалагдаж үлдсэн олон янзын, электрон, цаасан, цэгцтэй, замбараагүй мэдээлэл юм. Датаг тэр дундаа биг датаг IBM-н инженеерүүдийн санаачилсны дагуу 4V-р хэмждэг. Volume-Хэмжээ. Velocity-Хурд. Variety-Төрөл зүйл. Veracity-Үнэн зөв байдал.

Data Science дотор Дата майнинг, Дата анализ, Дата визуализэйшн багтдаг.

Дата Майнинг нь өмнө нь мэдээгүй, онцолж анзаараагүй байсан шинэ мэдээллийг датанаас гаргаж авах үйл явц юм. Энд machine learning-н техникүүд ашиглагддаг. Үүнийг өөрөөр Knowledge discovery гэнэ. Харин дата анализ нь датаг цуглуулж бэлдэх, цэвэрлэх, дүн шинжилгээ хийх, таамаглал гаргах, модел боловсруулах, гарсан үр дүнг бусдад танилцуулах гэсэн илүү өргөн хүрээтэй процесс юм.

Data mining vs Data analysis

Дата Майнинг нь статистик, датабааз, machine learning-тэй ажиллах чадварыг шаарддаг бол дата анализ нь эдгээр дээр нэмээд математик, програмчлал, AI, ажиллаж буй датаныхаа тухай мэдлэгтэй байхыг шаардана.

Дата Майнинг-н үр дүнд датанаас зүй тогтол бүхий мэдээлэл гардаг бол Дата анализ-н үр дүнд гаргасан таамаглын баталгаа эсвэл датаны тухай олон төрлийн мэдээлэл гарна. Жишээ нь дата Майнинг хайлт хийсэн хүн ямар хүн худалдан авалт хийж байгааг, дата анализ өнгөрсөн 10 жилийн хугацаан дах ажилгүйдлийн түүхэн мэдээлэлд шинжилгээ хийдэг.

Data Science and AI

AI буюу хиймэл оюун ухааныг ашиглаж буйн гол зорилго нь хүн шиг сэтгэдэг төхөөрөмж бүтээх юм. Жишээ нь: жолоочгүй машин, алимтай утасны Сири гэх мэт. Бодит амьдралд хамгийн их хэрэглэгдэж буй AI-н нэг салбар нь machine learning юм. Machine learning нь Data Science-нд тэр дундаа дата майнингийн үед их хэрэглэгддэг бөгөөд AI, Data Science хоёрын огтлолцол болдог.

Эндээс харвал нь Data Science нь дата майнинг, дата анализ, дата визуализэйшн-г өөртөө агуулах бөгөөд өөрөө machine learning-г хэрэглэдэг тул AI-тай мөн огтлолцдог “шинэхэн” шинжлэх ухаан юм.

Сэтгэгдэл

Leave a Reply

Your email address will not be published. Required fields are marked *