Днес специалистите по Data Science са необходими в почти всички сфери на бизнеса. Не е само финансово
Търсенето на специалисти по наука за данни е различноквалификациите нарастват всяка година. Според MADE Big Data Academy от Mail.ru Group и портала за набиране на персонал HeadHunter, през 2019 г. е имало 1,4 пъти повече свободни работни места в областта на анализа на данни в сравнение с 2018 г. А броят на свободните работни места в областта на машинното обучение е нараснал 1,3 пъти.
Растат и доходите на специалистите по данни. Според HH.ru, дори младши в Русия получава около 120 хиляди рубли, докато бизнес анализатор вече може да разчита на 170 хиляди рубли и повече, а анализатор на големи данни - от 200 хиляди рубли.

Кой е в търсенето и защо?
Най-често в Русия търсят специалисти по даннифинансови и ИТ компании. И най-често срещаното изискване за кандидатите е познаването на езика за програмиране Python. Среща се в 45% от работните места в науката за данни и близо половината (51%) в машинното обучение.
Разбира се, броят на учените по данни също расте. Според HH.ru 246 специалисти по анализ на данни и 47 специалисти по машинно обучение публикуват своите автобиографии всеки месец.
Списъкът с изисквания от кандидатите включва също:
- познаване на SQL;
- притежание на извличане на данни (Data Mining);
- уверени познания по математическа статистика;
- способност за работа с големи данни;
- притежание на C ++, Git, Linux.
В същото време около 65% от свободните работни места в областта на анализаданни и 50% от свободните работни места на специалисти в областта на машинното обучение са в Москва. Санкт Петербург се нарежда на второ място в Русия (съответно 15% и 18%). Разбира се, търсещите работа също са концентрирани предимно в двете столици. Но днес, за да се подложите на обучение, не е необходимо да се премествате някъде, но работата в отдалечен формат, на аутсорсинг, вече се превръща в нов формат за организиране на работния процес.
Къде да уча за учен по данни и какво е необходимо за това?
Има няколко подхода за обучение вучен за данни. Един от тях е по-класически, за да влезе в университет в областта на ИТ. Това може да се направи и в чужбина. Например обучението за магистър по наука за данни в американски университет може да ви струва много впечатляваща сума: от $ 30 хиляди до $ 120 хиляди. Дори онлайн курсовете в чуждестранни университети по тази специалност струват поне $ 9 хиляди. Има и такива, които не са готови харчете за вашето обучение в такъв мащаб, защото такива разходи все още трябва да бъдат възстановени, но това няма да се случи веднага. Например ученият по данни Ребека Викери, която работи в тази област от 10 години, е създала своя собствена програма, според която тя е изучавала самостоятелно Data Science. Този подход има и своите недостатъци: липса на обратна връзка и подкрепа от наставник или учител, дистанция от екипа, работа самостоятелно и накрая, мнозина намират този процес на обучение за скучен.
Друг вариант е онлайн обучението вспециализирани дигитални училища като SkillFactory. Студентите там не само се обучават на набор от техники и техники, но и се учат да учат. Освен това всеки ученик ще има наставник, който осигурява подкрепа и съдействие, а цялата работа, извършена в учебния процес, не може да се използва само като портфолио. Още докато е студент на SkillFactory, бъдещият учен за данни влиза в индустриалната общност - това не само помага да си намери работа, но и да общува с колеги, да споделя опит. Онлайн училището е убедено, че не е достатъчно само да научиш нови технологии - трябва да овладееш нови подходи и нови начини на мислене. И е трудно да се справите сами. Следователно всички ученици си дават обратна връзка, обменят код, помагат за намиране на грешки и споделят проблеми и реални случаи.
Какво трябва да може да направи младши учен по данни:
- използвайте основни алгоритмични конструкции и структури от данни на Python за проектиране на алгоритми;
- визуализирайте данни с помощта на Pandas, Matplotlib, Seaborne;
- създаване на модели за индустриално качество, използвайки класическо машинно обучение и невронни мрежи за решаване на проблеми на науката за данни;
- оценява качеството на модела (прецизност / изземване);
- интегрирайте решението в производството и бизнеса като цяло;
- работа със складове за данни от различен тип;
- работа с инструменти за анализ на големи данни;
- получаване на данни от уеб източници или чрез API;
- прилага методи за математически анализ, линейна алгебра, статистика и теория на вероятностите за обработка на данни.
Ако тези умения ви се струват много трудни, тогава можете да вземете курсовете по професия Data Scientist.
Кой е учен по данни и какво трябва да може да направи?
В основата си Data Science е следващата„Еволюционна“ стъпка на човечеството при работа с данни. По-ранни математици и статистици решавали подобни задачи. Сега, с появата на изкуствения интелект, оптимизацията и информатиката навлязоха в методите за анализ на данни, което означава, че нов подход за намиране на решения, базирани на данни, стана много по-ефективен от предишните „аналогови“ методи.
Работата на учен за данни започва със събиранетомасиви от големи данни: структурирани и не. След това те се преобразуват във формат, който е лесен за четене. Следващият етап: визуализация и работа със статистика. Като аналитични методи се използват машинно и дълбоко обучение, вероятностен анализ, прогнозни модели и невронни мрежи.

Пет основи за учен по данни
- Изкуственият интелект (ИИ) е областпосветени на създаването на интелигентни системи, които работят и се държат като хора. ИИ е свързан със сходната цел да се използват компютри за разбиране на човешкия интелект, но не е задължително да се ограничава до биологично приемливи методи. Съществуващите днес интелигентни системи имат много тесни области на приложение. Например програми, които могат да победят човек на шах, не могат да отговорят на въпроси.
- Машинно обучение -създаване на инструмент за извличане на знания от данни. ML моделите се обучават на данни независимо или поетапно: обучение с учител върху данни, изготвени от човек и без учител - работа със спонтанни, шумни данни.
- Дълбоко обучение -изграждане на многослойни невронни мрежи в области, където се изисква по-напреднал или по-бърз анализ и традиционното машинно обучение се проваля. "Дълбочината" се осигурява от множество скрити слоеве неврони в мрежата, които извършват математически изчисления.
- Големи данни - работа с големиобем често неструктурирани данни. Специфичността на сферата са инструментите и системите, които могат да издържат на големи натоварвания.
- Наука за данни - вядрото на областта е овластяването на набори от данни, визуализацията, събирането на идеи и вземането на решения въз основа на тези данни. Учените по данни използват някои от методите за машинно обучение и големи данни: изчислителни облаци, инструменти за създаване на виртуална среда за разработка и много други.
Като всяка друга професия, овладяване на ДанниНауката започва с основите - изучаването на математика, линейна алгебра и, разбира се, статистика. За сериозно разбиране на науката за данни, бъдещият специалист ще се нуждае от истински университетски курс по теория на вероятностите (включително смятане). За щастие днес такива материали е лесно да се намерят в Интернет или дори да се запишете за един семестър в най-добрите университети в Русия на платформата за отворено образование. Или вземете пълния курс по Наука за данни в SkillFactory, където основните знания ще бъдат първата стъпка в овладяването на нова професия. Математическите познания са от първостепенно значение за анализиране на резултатите от прилагането на алгоритми за обработка на данни. Разбира се, има силни инженери в машинното обучение без такова образование. Но това са предимно редки случаи.
Втората стъпка в превръщането в учен за данни е програмирането. Достатъчно е да научите поне един език, след като сте усвоили всички нюанси на синтаксиса му. Както бе споменато по-горе, един от най-търсените езици е Python.
Машинното обучение - третият компонентпрофесия учен на данни, когато вече няма нужда да пише инструкции за компютри, за да изпълнява определени задачи. ML се състои от три основни форми: учене под наблюдение, учене без надзор и засилване на обучението. Можете да прочетете повече за всеки тип обучение в нашия голям материал с професор Ян Лекун.
И накрая, последната стъпка е Data Mining (анализданни) и визуализация на данни, което е важен изследователски процес и включва анализ на скрити модели данни в съответствие с различни опции за превръщане в полезна информация, която се събира и формира в складовете за данни, за да се улеснят бизнес решенията, предназначени за намаляване на разходите и увеличаване на доходите.
Въпреки факта, че образование може да се получи вза сравнително кратко време ученият по данни трябва редовно да потвърждава квалификацията си, като посещава високо специализирани курсове, участва в хакатони, открити състезания и при търсене на работа. Независимо потвърждение на вашите квалификации ще бъде предимство. Например разширеният профил на Kaggle, който има система за ранг. Можете да преминете от начинаещ до гросмайстор. За успешно участие в конкурси, публикуване на сценарии и дискусии получавате точки, които повишават рейтинга ви. Освен това сайтът отбелязва в кои състезания сте участвали и какви са вашите резултати.
прилага
Вижте също:
Вижте къде лети Rover Perseverance
Симптоми на коронавирус при деца. На какво трябва да обърнете внимание?
Астрономите виждат как черна дупка излъчва трепкащи гама лъчи