Показать сообщение отдельно
Старый 08.12.2017, 16:10   #19  
George Nordic is offline
George Nordic
Модератор
Аватар для George Nordic
Злыдни
 
4,479 / 1250 (50) ++++++++
Регистрация: 17.12.2003
Адрес: Moscow
Записей в блоге: 9
Ладно. Давайте для начала разберемся что такое "BigData" и откуда она взялась.
Big Data - это не просто "много данных". Это, в первую очередь, слабоструктурированные и распределенные данные. В этом их основное отличие.

Откуда она пошла? Из поисковых систем - первый релиз сделали специалисты Yahoo, потом эту инициативу подхватили Google, поддержав тот самый Hadoop. Вот уже где много слабоструктурированной (тексты, форумы, музыка, видео и т.д.) и, тем более, распределенной информации. И, да - хранение, обработка, индексирование и быстрый поиск - очень важная для них задача.

Является ли миллиард чеков "Большими Данными"? Нет. А сто миллиардов, даже если они побиты по 10 базам? Тоже нет. Потому что выдача запроса от non-sql поисковой системы - это выборка с определенной релевантностью.

Т.е. если вы в реляционнку подадите запрос "Дай-ка, мне дорогая, чек №1000000" (Select * from bills where bills.billid == "1000000") - вы получите 1 чек с номером 1000000.
И если вы ее попросите "А теперь дай-ка, мне дорогая, чеки с суммой покупки более 10 000 000" (Select * from bills where bills.amount >= "10000000") - вы получите все чеки с суммой покупки более 10 млн.

А вот если вы первый запрос пошлете в Non-SQL, результат может Вас сильно удивить, так как кроме чека с номером 1 000 000 у вас будет "Как получить 1 000 000 подписчиков на Youtube", "Как украсть миллион", "1000000 рецептов борща" и еще какой-нибудь "How to earn you first million". Да, а чека, кстати, там может и не быть. Или быть далеко не первым в выдаче.
Конечно, чем лучше профилированны и протегированны данные, тем релевантнее будет выборка.

А задач много. И не только в соцсетях и телекоме. Но и вполне себе в ритейле.

С Уважением,
Георгий
За это сообщение автора поблагодарили: mazzy (2).