Роль методов визуализации учебной информации в обучении. Способы визуального представления данных. Методы визуализации

    Визуализация - ИЗОБРАЖЕНИЙ 24. Визуализация Display Визуальное представление данных Источник: ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения …

    Способ отображения информации о состоянии технологического оборудования и параметрах технологического процесса на мониторе компьютера или операторской панели в системе автоматического управления в промышленности, предусматривающий также… … Википедия

    В общем смысле метод представления информации в виде оптического изображения (например, в виде рисунков и фотографий, графиков, диаграмм, структурных схем, таблиц, карт и т. д.). Очень эффективно визуализация используется для представления… … Словарь бизнес-терминов

    Египетские иероглифы позволяли интуитивно наглядно описывать понятия … Википедия

    Визуализация типовой формы - 98. Визуализация типовой формы Form flash Визуальное представление типовой формы Источник: ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения … Словарь-справочник терминов нормативно-технической документации

    Визуализация - (лат. visualis зрительный) 1. формирование зрительного наглядного или мысленного образа (например, можно «воочию» представить себе страницу книги, где находится нужный текст); 2. в психопатологии присоединение к нарушениям мышления зрительных… … Энциклопедический словарь по психологии и педагогике

    ГОСТ 27459-87: Системы обработки информации. Машинная графика. Термины и определения - Терминология ГОСТ 27459 87: Системы обработки информации. Машинная графика. Термины и определения оригинал документа: 5. Абсолютная команда визуализации Absolute command Команда визуализации, в которой используются абсолютные координаты… … Словарь-справочник терминов нормативно-технической документации

    Содержание 1 Как это работает 2 Безопасность 3 Действующие службы передачи дорожной … Википедия

    извлечение информации из данных - разведка данных Технология анализа хранилищ данных, базирующаяся на методах ИИ и инструментах поддержки принятия решений. Процесс обнаружения корреляции, тенденций, шаблонов, связей и категорий. Выполняется путем тщательного исследования данных с … Справочник технического переводчика

    Тип Сист … Википедия

Книги

  • , Кабаков Роберт И.. R -это мощный язык для статистических вычислений и графики, который может справится поистине с любой задачей в области обработки данных. Он работает во всех важных операционных системах и…
  • R в действии. Анализ и визуализация данных на языке R , Роберт И. Кабаков. R– это мощный язык для статистических вычислений и графики, который может справиться поистине с любой задачей в области обработки данных. Он работает во всех важныхоперационных системах и…

Создание визуального контента - это порой дорого, трудно и отнимает много времени. Резонный вопрос: стоит ли этим заниматься?

Данные везде, данные повсюду.

Как говорит Дэвид Маккэндлесс, дизайнер, писатель и журналист в области инфографики, а также автор известной книги «Инфографика. Самые интересные данные в графическом представлении», сегодня человечество живет в информационных джунглях.

Каждую минуту в нашей жизни появляется немыслимое количество новой информации. Мы даже не замечаем этого. Одни лишь твиты, лайки и загрузки фотографий на социальные платформы исчисляются цифрами с 5-6 нулями. Не говоря уже о бесконечном количестве статей, видео-роликов, финансовых операций, аналитических отчетов и многих других вещей, которые сразу могут не прийти в голову, но, безусловно, существует в нашей жизни.

Если верить исследованиям компании Domosphere, предоставляющей программные решения для обработки, систематизации и визуализации бизнес-информации, то с 2013 года количество интернет-пользователей во всем мире выросло с 2,4 млрд. человек до 3,2 млрд человек.

Такой стремительный рост дает огромный толчок развитию высоких технологий и в результате буквально каждый год мы видим, как на рынок выходят все новые системы и гаджеты.

Например, компания, разработавшая мобильное приложение Vine для создания коротких (менее 6 секунд длительностью) видео-роликов, была основана буквально 3 года назад, в июне 2012 года. Twitter выкупила стартап в октябре и открыла для широкой публики в январе 2013. Сегодня каждую секунду в мире просматривается более 1 млн. вайн-роликов, а популярные вайнеры зарабатывают десятки сотен долларов на ведении аккаунтов компаний или на размещении срытой рекламы в своих видео.

Если говорить о других популярных социальных платформах, блогах и приложениях, то с 2013 года

  • количество твитов, отправляемых пользователями за в минуту, увеличилось со 100 до 347 тыс,
  • количество часов видео, загружаемого на YouTube – c 72 до 300 часов,
  • число скачиваний приложений Applec 48 до 51 тыс,
  • а количество пинов на Pinterest – c 3,5 до 9,7 тыс.

Как результат, общая картина роста информации в интернете за 1 минуту времени сегодня выглядит приблизительно следующим образом.

Инфографика: рост количества информации в интернете за минуту в 2015 году.

Добро пожаловать в 2015 год!

По прогнозам Комиссии по широкополосному соединению и развитию цифровых технологий число интернет-пользователей к 2020 году увеличится в 2 раза. Соответственно также возрастут объемы информации, которые уже сейчас измеряются в огромными числами.

Петабайт

Если верить Векипедии, то сегодня:

– Google ежедневно обрабатывает около 24 петабайт данных.

– Через сети американского провайдера AT&T еженедельно проходит 19 петабайт трафика.

– Размер результатов экспериментов, проводимых на большом адронном коллайдере за год, достигает 4 петабайта .

Для сравнения:

Все письменное наследие человечества на всех языках мира с момента зарождения письменности составляет всего около 50 петабайт информации. (Из книги «Игфографика. Визуальное представление данных» Рэнди Крам)

Конечно, доступ к таким большим объемам данных открывает перед человечеством безграничные возможности. Позволяет более детально изучать окружающий мир, ломает стереотипы и помогает прогнозировать будущее. Тем не менее, если использовать только традиционные способы работы с информацией, то человек физически не способен справится с объемами и вынужден искать варианты решения проблемы.

Сила визуализации

Как наш мозг воспринимает информацию

Данные, которые выглядят, как абсолютная тарабарщина в обычном виде, становятся понятными и логичными, стоит их преобразовать в графики, диаграммы или видео. Если у нас получается грамотно представить информацию визуально, то мы получаем возможность лучше понимать окружающих людей. Тем не менее, очень многие беспокоятся о том, что визуальное представление значительно упрощает информацию и мы теряем много важный данных в процессе преобразования цифр и текста в графику. Так ли это на самом деле?

Теряем ли мы данные, когда преобразуем цифры и текст в графику?

В 2011 году учеными Эмре Сойер и Рибином Хогартом было проведено исследование среди экономистов. Испытуемых разделили на три группы в зависимости от формы представления информации, которую им предстояло изучить, и попросили ответить на 3 вопроса. В итоге были получены следующие результаты:

1 группа: получила данные в виде классической статистической отчетности - 72% человек дали неверный ответ;

2 группа: получила данные в виде классической статистической отчетности и в виде графика - 61% дали неверный ответ;

3 группа: получила данные только в виде графической информации - ошиблись только 3%.

Вывод очевиден: визуализация данных в некоторых случаях позволяет намного лучше воспринимать информацию, чем цифры и текст!

Посмотрите выступление Дэвида Маккэндлесса на TED Talks. Насколько очевидными становятся многие вещи, когда мы получаем возможность оценить их визуально.

Дэвид Маккэндлесс на TED Talks.

Визуализация информации и развитие технологий.

Безусловно, рост спроса на визуализацию данных стимулирует развитие технологий. Хотя обратное тоже верно и новые технологии повышают требования к качеству графики. В любом случае, сегодня составить презентацию на основе графиков и диаграмм, сделать инфографику или снять видео-ролик, не является большой проблемой. Огромное количество графических онлайн и оффлайн программ можно легко найти, изучить и реализовать с их помощью свои самые фантастические идеи.

Можно установить Photoshop или Illustrator и создать визуализацию с нуля. Можно воспользоваться более специализированными графическими приложениями, такими как Piktochart, Easel.ly или Visual.ly и разрабатывать графику на основе шаблонов. Даже не буду пытаться перечислить то бесконечное количество фотостоков, стоков с 3D- и видео-графикой, которые сегодня существует на бескрайних просторах интернета. За небольшую плату их ресурсы смогут стать достойным украшением любой вашей инфографики или видео-презентации

Picktochart

Визуализация и социальные платформы.

Взгляните еще раз на инфографику о росте скорости информации и посчитайте, какое примерное количество ресурсов, перечисленных в ней, являются графическими платформами. Instagram, Pinterest, YouTube, Vine, Netflix, Snapchart – все они были разработаны специально для публикации визуального контента. Частично к этой группе можно также отнести Twitter, Facebook и другие популярные социальные сети, так как их интерфейс не предполагает публикацию длинных текстовых зарисовок. Зато на них очень хорошо смотрятся видео-материалы, фотографии и любая другая графика. Стоит ли упоминать, что среди всех перечисленных ресурсов, вы не найдете ни одного, где бы графический контент вообще не использовался.

Все интернет-исследования из года в год повторяют одно и тоже: визуальные материалы способствуют популяризации аккаунтов, групп и блогов. Использование графического контента в Twitter увеличивает число репостов на 35%, в Facebook – на 87%. Популярность блогов с графикой возрастает на 47%.

Статистика по Twitter

Статистика по Facebook

Сравните два варианта передачи информации, по смыслу абсолютно равнозначные. Какой из них больше привлечет ваше внимание?

Графика vs. Текст

Как визуализация влияет на уровень доверия читателей?

Научно доказано, что визуальный контент способствует росту доверия к текстовым материалам.

Некоторой группе интернет-пользователей было предложено подтвердить или опровергнуть ряд высказываний. Один из примеров: «Орехи макадамия и персики принадлежат к одному и тому же семейству.» В 50 случаях из 100 утверждения, сопровождающиеся картинками, были оценены, как правдивые вне зависимости от того, являются они таковыми или нет.

Орехи макадамия

Другими словами, участники в большей степени доверяли именно тем высказываниям, которые сопровождались фотографиями.

Заключение

В заключении хочется отметить, что любая визуализация данных - инфографика, видео-ролики или просто обычные фотографии - приносит пользу, тогда и только тогда, когда она интересно придумана, талантливо реализована и вовремя и к месту опубликована. Волшебство происходит, только если хорошая идея сочетается с грамотным дизайном и поддерживается умелым маркетингом. В противном случае все вышеперечисленные плюсы мгновенно самоликвидируются и вы принесете проекту больше вреда, чем пользы.

Само по себе понятие является достаточно многогранным, существует несколько определений в зависимости от того, о каком поле деятельности идет речь. Целью визуализации является Это означает, что данные должны исходить от чего-то абстрактного или, по крайней мере, не быть очевидными сразу. Визуализация объектов исключает фотосъемку и это превращение из невидимого в видимое.

Визуализация данных

Визуализация информации - это процесс представления абстрактных деловых или научных данных в виде изображений, которые могут помочь в понимании смысла данных. Что такое визуализация информации? Это понятие можно определить как сопоставление дискретных данных и их визуальное представление. Это определение не охватывает все аспекты визуализации информации, такие как статическая, динамичесая (анимация) и наиболее актуальная на сегодняшний день интерактивная визуализация. Помимо различий между интерактивной визуализацией и анимацией, самая полезная категоризация основывается на научной визуализации, которая обычно осуществляется при помощи специализированного программного обеспечения. Важная роль отводится наглядности в образовательной сфере. Это очень полезно, когда речь идет о преподавании тем, которые трудно представить без конкретных примеров, например, строение атомов, которые слишком малы, чтобы можно было их изучить без дорогостоящего и сложного в использовании научного оборудования. Визуализация позволяет проникнуть в любой мир и представить себе то, что, казалось бы, представить невозможно.

3D-визуализация

Программное обеспечение помогает конструкторам и специалистам цифрового маркетинга создавать визуальное изображение продукта, проекта или виртуальных прототипов в формате 3D. Визуализация предоставляет разработчикам инструменты, которые могут расширить передовые Визуализация с помощью визуальных образов является эффективным способом общения. Зрительное представления является одним из лучших способов коммуникации с потенциальными клиентами. Эффективное общение позволяет тратить больше времени на улучшение своих проектов и продуктивное взаимодействие. Визуализация 3D представляет собой технику создания объемных изображений, диаграмм или анимации.

Использование визуализации в науке

Сегодня визуализация имеет постоянно расширяющийся ассортимент приложений в области науки, образования, техники, интерактивных мультимедиа, медицины и многих других. Свое применение нашла визуализация также в области компьютерной графики, наверное, одном из самых важных событий компьютерного мира. Развитие анимации также способствует продвижению визуализации. Использование визуализации для представления информации - это не новое явление. Она была использована в картах, научных рисунках на протяжении более тысячи лет. Компьютерная графика с самого начала использовалась для изучения научных проблем. Большинство людей знакомы с цифровой анимацией, например, в виде представления метеорологических данных во время сводки погоды по телевидению. Телевизор также предлагает версию научной визуализации, когда он показывает прорисованные с помощью компьютерных программ и анимированных реконструкций дорог или аварий самолета. Некоторые из самых интересных примеров, созданных компьютером, включают изображение реального космического корабля в действии, в пустоте далеко за пределами Земли или на других планетах. Динамические формы визуализации, такие как образовательные анимации или графики, имеют потенциал для повышения качества обучения, так как системы визуализации меняются с течением времени.

Ключ к достижению поставленных целей

Что такое важный инструмент личностного развития. Подобно тому как мотивирующие аффирмации могут помочь сосредоточиться на достижении своих целей, то же самое можно сделать и с помощью визуализации или мысленных образов. Хотя методы визуализации в этом смысле стали очень популярны в качестве средства для развития личности с конца семидесятых и в начале восьмидесятых, люди использовали ментальные образы для осуществления своих желаний еще в древности.

Творческий инструмент

Что такое визуализация? Это использование воображения для создания ментальных образов того, чего мы хотим в нашей жизни. Вместе с фокусированием и эмоциями она становится сильным творческим инструментом, который помогает в достижении желаемой цели. При правильном использовании это может привести к самосовершенствованию, хорошему здоровью и различным достижениям, например, в карьере. В спорте ментальные образы как средства визуализации часто используются спортсменами для повышения своих навыков. Использование визуализации как техники неизменно приводит к гораздо лучшей производительности и результатам. Это также справедливо и в бизнесе, и в жизни.

Как это работает?

Визуализация, или воображение, работает на физиологическом уровне. Нейронные связи, возникающие в мозгу, иначе говоря, мысли, могут стимулировать нервную систему точно так же, как реальное событие. Такого рода "репетиции", или прогонка определенных событий в голове, создают нейронные колебания, которые заставят мышцы делать то, что от них требуется. Взять, например, тех же спортсменов. На время спортивных соревнований важным является не только исключительные физические навыки, но и четкое понимание игры и определенный психологический и эмоциональный настрой. Для большей эффективности, как и любой другой навык, воображение необходимо регулярно тренировать. Без чего является невозможной визуализация? Уроки развития воображения включают в себя важные элементы, а именно ментальные образы релаксации, реалистичность и систематичность.

Когда использовать визуализацию?

Зрительное наблюдение успешных результатов своей деятельности можно проводить абсолютно по любому поводу. Многие используют визуализацию для оживления своих целей. Многие спортсмены, актеры и певцы достигают чего-то сначала в своих умах, а затем только в реальности. Это помогает сосредоточиться и устранить некоторые предварительные страхи и сомнения. Это своеобразная разминка или репециция, которую можно проводить перед важным и волнительным событием. Визуализация - это прекрасный инструмент для подготовки, который неизменно приводит к повышению уровня производительности.

Как осуществляется процесс визуализации?

Можно пойти куда-нибудь в тихое и уединенное место, где вас никто не побеспокоит, закрыть глаза и думать о цели, настрое, поведении или навыках, которые вы хотите приобрести. Сделайте несколько глубоких вдохов и расслабьтесь. Старайтесь визуализировать предмет или ситуацию так четко и во всех подробностях, как это возможно. Эмоции и чувства при этом также играют большую роль, старайтесь прочувствовать то, чего хочется больше всего на свете. Практиковать упражнение стоит, по крайней мере, дважды в день примерно по 10 минут каждый раз и упорствовать до тех пор, пока не добьетесь успеха. Немаловажно также поддерживать и хорошее настроение на протяжении всего процесса.

Преимущества визуализации

Систематическая визуализация модели своего желания поможет лучше ориентироваться на пути достижения поставленных целей, будет вдохновлять и мотивировать, повысит настроение с помощью позитивных, приятных изображений и избавит от негативных эмоций. В жизни и в работе успех начинается с цели. Это может быть потеря веса, повышение по службе, избавление от вредных привычек, начало собственного бизнеса. Большие или маленькие цели дают важный ориентир. Они как компас - помогают двигаться в правильном направлении. Визуализация была описана еще Аристотелем более 2000 лет тому назад. Великий мыслитель своего времени описал этот процесс такими словами: "Во-первых, должен быть определенный, ясный, практический идеал, цель или задача. Во-вторых, есть необходимые средства для их достижения: мудрость, деньги, средства и методы. В-третьих, самое главное - это научиться управлять всеми необходимыми средствами для достижения желаемого результата".

Видеть - значит верить

Обычно происходит так: не поверю, пока не увижу. Прежде чем поверить в достижимость цели, сначала нужно иметь об этом визуальное представление. Техника создания мысленного образа будущего события дает возможность представить желаемые результаты и прочувствовать радость от их достижения. Когда это происходит, человек мотивируется и приобретает готовность добиваться своей цели.
Стоит помнить, что это не хитрый трюк, не просто мечты и надежды на будущее. Скорее, визуализация - это хорошо разработанный метод повышения эффективности, которым пользуются успешные люди в самых разных областях. Исследования показывают, что визуализация повышает спортивные показатели за счет улучшения мотивации, координации и концентрации. Это также помогает в релаксации и позволяет уменьшить страх и тревогу.

Почему визуализация работает?

По данным исследований, в которых использовались снимки мозга, запечатлевшие работу визуализации, можно сделать вывод о том, что нейроны в мозгу, эти электрически возбудимые клетки, которые передают информацию, интерпретируют образы в качестве эквивалента реальных жизненных действий. Мозг генерирует импульс, это создает новые нейронные пути — скопления клеток в нашем мозге, которые работают вместе, чтобы воссоздать воспоминания или поведенческие шаблоны. Все это происходит без физической активности, но таким образом мозг как бы программирует сам себя на успех. Огромным плюсом силы визуализации является то, что она доступна абсолютно для всех людей.

Неразрывная связь между умом и телом

Визуализация является психической практикой. С ее помощью мощно задействуются естественные силы разума. Мы можем использовать силу разума, чтобы стать успешными во всех сферах нашей жизни. Психологические методики учат нас, как использовать воображение, чтобы представить себе конкретные вещи, которые мы хотим иметь в нашей жизни. Весьма замечательно то, что наши мысли влияют на нашу реальность.

Ученые доказали, что мы используем всего 10% от общего потенциала нашего мозга, и это в лучшем случае. Можно ли научиться более эффективно использовать наши природные способности? Системы визуализации представляют собой неразрывные биологические связи между умом и телом, а также связь между умом и реальностью. Если мы научимся использовать воображение и визуализацию в правильном направлении, то она может стать чрезвычайно мощным средством для получения того, что мы хотим в нашей жизни. Важно научиться использовать силу нашего разума совместно с творческими подходом, который помогает раскрыть и развить скрытые таланты и возможности.

Визуализация информации

По сложившейся уже традиции, начнем с определœения.

Визуализация информации – представление информации в виде графиков, диаграмм, структурных схем, таблиц, карт и т.д.

ecsocman.edu.ru

Зачем визуализировать информацию? "Глупый вопрос!" – воскликнет читатель. Конечно же, текст с картинками воспринимается лучше, чем "серый" текст, а картинки с текстом воспринимаются еще лучше. Недаром всœе мы так любим комиксы – ведь они позволяют нам буквально схватывать информацию на лету, казалось бы, не прикладывая ни малейших умственных усилий! А вспомните, насколько хорошо запоминался вам во время учебы материал тех лекций, которые сопровождались слайдами!

Первое, что приходит нам в голову при слове "визуализация", - ϶ᴛᴏ графики и диаграммы (вот она, сила ассоциаций!). С другой стороны, визуализировать таким образом можно только числовые данные, никому еще не удавалось построить график на базе связного текста. Для текста мы можем построить план, выделить основные мысли (тезисы) – сделать краткий конспект. О недостатках и вреде конспектирования мы поговорим чуть позже, а сейчас скажем о том, что если объединить план и краткий конспект – "развесить" тезисы по ветвям дерева, структура которого соответствует структуре (плану) текста͵ – то мы получим отличную структурную схему текста͵ которая запомнится намного лучше, чем любой конспект. В этом случае ветви будут играть роль тех "треков" – дорожек, связывающих понятия и тезисы, о которых мы говорили ранее.

Помните, как мы строили UML-диаграммы на базе описания проектируемой программной системы, полученного от ее будущих пользователœей? Полученные картинки воспринимались и клиентами, и разработчиками намного проще и быстрее, чем текстовое описание. Точно так же можно "изобразить" абсолютно любой текст, не только техническое задание на разработку системы. Подход, описанный нами выше, позволяет визуально представить абсолютно любой текст – будь это сказка, техническое задание, лекция, фантастический роман или результаты совещания – в виде удобного и простого для восприятия дерева. Строить его можно как угодно – лишь бы получилась наглядная и понятная схема, которую хорошо бы еще проиллюстрировать подходящими по смыслу рисунками.

Такие схемы удобно применять и в общении при обсуждении каких-либо вопросов и проблем. Как показывает практика, отсутствие четких стандартов нотации не создает абсолютно никаких коммуникативных сложностей для участников обсуждений. Наоборот, использование невербальных форм представления информации позволяет концентрировать внимание именно на ключевых точках проблемы. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, визуализация является одним из наиболее перспективных направлений повышения эффективности анализа, представления, восприятия и понимания информации.

Ух, наконец-то мы покончили с нудным описанием научных теорий, методов и приемов, применяющихся для обработки, систематизации и визуализации информации! Предыдущая часть главы сильно утомила и автора, и читателœей, и тем не менее, она была необходима: в результате мы увидели, что особенности работы нашего мозга уже активно применяются учеными в самых разных областях науки, многие вещи, которые кажутся нам привычными, – персональные компьютеры, пользовательские интерфейсы, базы знаний и т.д. – изначально строились с учетом ассоциативного характера человеческого мышления и его склонности к иерархическому представлению и визуализации информации. Но вершиной и естественным графическим выражением мыслительных процессов человека является mind mapping, к обсуждению которого мы наконец-то переходим. А заодно попытаемся расширить наше понимание принципов визуального мышления.

Визуализация информации - понятие и виды. Классификация и особенности категории "Визуализация информации" 2017, 2018.

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений DM - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято

классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

"лица Чернова";

лепестковые диаграммы.

Представление пространственных характеристик

Отдельным направлением визуализации является наглядное представление

пространственных характеристик объектов. В большинстве случаев такие средства выделяют на карте отдельные регионы и обозначают их различными цветами в зависимости от значения анализируемого показателя.



Карта представлена в видеграфического интерфейса, отображающего данные в виде трехмерного ландшафтапроизвольно определенных и позиционированных форм (столбчатых диаграмм, каждая синдивидуальными высотой и цветом). Такой способ позволяет наглядно показыватьколичественные и реляционные характеристики пространственно-ориентированных

данных и быстро идентифицировать в них тренды.

Процесс Data Mining. Анализ предметной области. Постановка задачи. Подготовка данных.

Процесс Data Mining. Начальные этапы

Процесс DM является своего рода исследованием. Как любое исследование, этот процесс состоит из определенных этапов, включающих элементы сравнения, типизации, классификации, обобщения, абстрагирования, повторения.

Процесс DM неразрывно связан с процессом принятия решений.

Процесс DM строит модель, а в процессе принятия решений эта модель эксплуатируется.

Рассмотрим традиционный процесс DM. Он включает следующие этапы:

анализ предметной области;

постановка задачи;

подготовка данных;

построение моделей;

проверка и оценка моделей;

выбор модели;

применение модели;

коррекция и обновление модели.

В этой лекции мы подробно рассмотрим первые три этапа процесса Data Mining,

остальные этапы будут рассмотрены в следующей лекции.

Этап 1. Анализ предметной области

Исследование - это процесс познания определенной предметной области, объекта или явления с определенной целью.

Процесс исследования заключается в наблюдении свойств объектов с целью выявления и оценки важных, с точки зрения субъекта-исследователя, закономерных отношений между показателями данных свойств.

Решение любой задачи в сфере разработки программного обеспечения должно начинаться с изучения предметной области.

Предметная область - это мысленно ограниченная область реальной действительности, подлежащая описанию или моделированию и исследованию.

Предметная область состоит из объектов, различаемых по свойствам и находящихся в определенных отношениях между собой или взаимодействующих каким-либо образом.

Предметная область - это часть реального мира, она бесконечна и содержит как

существенные, так и не значащие данные, с точки зрения проводимого исследования.

Исследователю необходимо уметь выделить существенную их часть. Например, при решении задачи "Выдавать ли кредит?" важными являются все данные про частную жизнь клиента, вплоть до того, имеет ли работу супруг, есть ли у клиента несовершеннолетние дети, каков уровень его образования и т.д. Для решения другой задачи банковской деятельности эти данные будут абсолютно неважны. Существенность данных, таким образом, зависит от выбора предметной области.