Водни мъчения - Аналогията на аналитиката стига до моста твърде далеч

капково анализиране

Данните, като водата, се предлагат в много форми. Човешкият ум еволюира, за да филтрира повечето данни, които ни попадат, защото просто има толкова много от тях.

Когато отворите очите и ушите си, данните са навсякъде. Цветът на стената, звукът на климатика и миризмата на кафето на съседа ви се третират като влажност. Водата е във въздуха през цялото време, но не е полезно да й обръщате голямо внимание.

Когато водата се кондензира в мъгла, тя ви принуждава да я видите и прави разбирането на света около вас още по-трудно. Непълните набори от данни, повредените данни, лошата наука, фалшивите заключения и когнитивните пристрастия ви карат да се изгубите в мъглата.

Данните падат като дъжд. Когато има само малко, това е диво неудовлетворяващо - достатъчно, колкото да замърси колата ви и да обърка разговора. Ще откриете, че изтривате мястото на очилата си, докато някой излива някаква случайна точка от данни, взета от някакъв неясен източник.

  • Застояла вода в плитко езерце е опасно. Данните, събрани от ненадеждна доставка, нито изчистени, нито нормализирани и оставени да застой, могат лесно да доведат до грешни заключения.
  • A стабилна струйка вода може да бъде достатъчно, за да запълни столова или да поддържа горска екосистема. Само три точки с данни (броят на изпратените имейли, срещу отворени, срещу кликнати) могат да поддържат маркетингова програма.
  • A по-здравословен поток от данни под формата на малка рекичка може да се използва за къпане. Непрекъснатият поток от данни позволява сравнителен анализ и сравнение в миналото. Оптимизацията на целевата страница може да се осъществи със стабилни данни за преобразуване.
    A скромна река може да задвижва мелница, за да реже дърво или да мели жито. Един механизъм за препоръки се нуждае само от надежден принос на няколко притока, за да осигури увеличение на стойността на количките за пазаруване.
  • A водопад на може да задвижва огромно водно колело и достатъчен приток на информация може да задейства система за динамично съдържание в реално време.
  • A река това е достатъчно широко и дълбоко може да подкрепи цяла транспортна индустрия. Достатъчно данни могат да плават на баржи и товарни кораби под формата на колекция от бисквитки от рекламни мрежи, агрегатори на данни от програмата за лоялни клиенти и посредници на данни.

Когато данните пристигнат в очаквани количества в очакваното време, те могат да бъдат уловени, канализирани и пуснати в употреба. Напоителните системи, язовирите и резервоарите осигуряват усещане за контрол и позволяват изграждането на все по-широка инфраструктура с канали, шлюзове и язовири. Складовете за данни са изградени върху по-малко надеждни потоци.

Чистотата е до благочестието

Чистата вода е жизненоважна за успеха на живота, напояването, пускането на електроцентрали и т.н. Дефиницията на „чиста“ може да се промени за целта; Всичко е наред, ако във водата има водорасли, които охлаждат електроцентрала и не е приемливо, ако в питейната вода има повече от 10 части на милиард арсен.

Данните са същите. В приложение за директна поща, дали имате заглавие на човек (г-н, г-жа, г-жа), е без значение ... освен ако не изпращате поща на лекари. Но мръсните данни ще ви спънат всеки път.

Като главен учен по данни на САЩ, DJ Patil, изкажете го на срещата на върха на техническия директор на първия кръг, „Ако не мислите как да поддържате данните си чисти от самото начало, вие сте ^ ^ и изд. Гарантирам го. Опитът да го изчистите след това ще отнеме поне месеци. "

Ако загреете водата до точката на кипене, тя може да задейства цяла индустриална революция. Изглежда, че данните правят същото. От момента, в който компютрите могат да съхраняват, както и да изчисляват, данните се събират толкова бързо, колкото съоръжението за съхранение може да бъде създадено за това.

Езерото с данни

Тъй като данните от тези притоци се стичат през двигателите на мелниците, всичко се озовава в езерото, зад язовира. Тъй като данните се пускат контролирано, те задвижват турбините на индустрията за данни; тези гигантски двигатели за обработка на данни с имена като Google и Facebook. Тук няма да има суша.

И накрая, има дълбок воден басейн, който чака анализаторът да се потопи. Акумулаторно оборудване и пистолет за копие в ръка, анализаторът изследва дълбочината, картографира нова земя и открива нови видове. Много е вълнуващо време да бъдеш изследовател на данни.

Ето защо толкова много от тях се появяват за Среща на върха eMetrics от 2002 г. Следващата възможност е в Бостън, от 27 септември до 1 октомври 2015 г.

eMetrics Summit Регистрация

A Bridge Too Far

А какво ще кажете за силата на данните, за да издълбаете следващия Гранд Каньон? Ами ледниковото топене на структурираните данни? Как се отнасяме към отпадъчните води в свят, който става все по-съзнателен за поверителността?

Това са въпроси за друг път и вода под моста.

Какво мислите?

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните за коментарите ви.