Veri Biliminde kimler çalışmalı ve nereden başlamalı

Günümüzde işin hemen hemen her alanında Veri Bilimi uzmanlarına ihtiyaç duyulmaktadır. Bu sadece finansal mesele değil

veya BT şirketleri. Veri bilimcileri pazarlama, satış, ürün geliştirme, yönetim kararları, trafik tahminleri ve karmaşık teknoloji sistemlerinin güvenliğinin sağlanması konularında talep görmektedir.

Veri bilimi uzmanlarına olan talep farklınitelikler her yıl artıyor. Mail.ru Group'tan MADE Big Data Academy ve işe alım portalı HeadHunter'a göre, 2019'da veri analizi alanında 2018'e göre 1,4 kat daha fazla açık kadro vardı. Makine öğrenimi alanındaki boş kadroların sayısı 1,3 kat arttı.

Veri bilimcilerinin kazançları da artıyor. HH'ye göre.ru, Rusya'da bir genç bile yaklaşık 120 bin ruble alırken, bir iş analisti zaten 170 bin ruble ve daha fazlasına ve büyük bir veri analisti - 200 bin ruble'ye güvenebilir.

Kimler talep görüyor ve neden?

Çoğu zaman Rusya'da veri bilimcileri arıyorlarfinans ve BT şirketleri. Ve adaylar için en yaygın gereksinim Python programlama dili bilgisidir. Veri bilimindeki işlerin% 45'inde ve makine öğreniminde neredeyse yarısında (% 51) görülür.

Elbette veri bilimcilerin sayısı da artıyor. HH.ru'ya göre 246 veri analizi uzmanı ve 47 makine öğrenimi uzmanı her ay özgeçmişlerini yayınlıyor.

Başvuru sahiplerinin gereksinimlerinin listesi ayrıca şunları içerir:

  • SQL bilgisi;
  • veri madenciliğine sahip olma (Veri Madenciliği);
  • matematiksel istatistik konusunda kendine güvenen bilgi;
  • büyük verilerle çalışma yeteneği;
  • C ++, Git, Linux'a sahip olmak.

Aynı zamanda, analiz alanındaki boş pozisyonların yaklaşık% 65'iverileri ve makine öğrenimi alanındaki uzmanların boş pozisyonlarının% 50'si Moskova'da. St. Petersburg, Rusya'da ikinci sırada (sırasıyla% 15 ve% 18). Elbette, iş arayanlar da çoğunlukla iki başkentte yoğunlaşmış durumda. Ancak bugün, eğitim almak için bir yere taşınmak gerekli değildir, ancak dış kaynak kullanımı konusunda uzak bir formatta çalışmak, şimdiden iş akışını organize etmek için yeni bir format haline gelmektedir.

Bir veri bilimcisi için nerede çalışılmalı ve bunun için ne gereklidir?

Öğrenmeye yönelik birkaç yaklaşım varveri bilimcisi. Bunlardan biri, BT alanlarında bir üniversiteye girmek için daha klasik olanıdır. Bu, yurt dışında da yapılabilir. Örneğin, bir Amerikan üniversitesinde Veri Bilimi alanında yüksek lisans eğitimi almak size çok etkileyici bir miktara mal olabilir: 30 bin dolardan 120 bin dolara. Bu uzmanlıktaki yabancı üniversitelerdeki çevrimiçi kurslar bile en az 9 bin dolara mal oluyor. Hazır olmayanlar var eğitiminize böyle bir ölçekte harcama yapın, çünkü bu tür maliyetlerin yine de telafi edilmesi gerekir, ancak bu hemen olmayacak. Örneğin 10 yıldır bu alanda çalışan veri bilimci Rebecca Vickery, Veri Bilimi üzerine bağımsız olarak çalıştığı kendi programını oluşturdu. Bu yaklaşımın da dezavantajları vardır: bir mentordan veya öğretmenden geribildirim ve destek eksikliği, takımdan uzaklık, yalnız çalışmak ve son olarak, çoğu kişi bu öğrenme sürecini sıkıcı bulmaktadır.

Diğer bir seçenek de çevrimiçi eğitimdirSkillFactory gibi uzmanlaşmış dijital okullar. Öğrencilere sadece bir dizi teknik ve teknik öğretilmez, aynı zamanda öğrenmeyi de öğretir. Ayrıca her öğrencinin destek ve yardım sağlayan bir mentoru olacak ve öğrenme sürecinde yapılan tüm çalışmalar sadece portföy olarak kullanılamayacak. Hâlâ SkillFactory öğrencisi iken, geleceğin veri bilimcisi endüstri topluluğuna giriyor - bu sadece bir iş bulmaya değil, aynı zamanda meslektaşlarla iletişim kurmaya ve deneyimleri paylaşmaya da yardımcı oluyor. Çevrimiçi okul, sadece yeni teknolojileri öğrenmenin yeterli olmadığına inanıyor - yeni yaklaşımlar ve yeni düşünme şekillerinde ustalaşmanız gerekiyor. Ve bununla tek başına baş etmek zor. Bu nedenle, tüm öğrenciler birbirlerine geri bildirimde bulunur, kod alışverişinde bulunur, hataları bulmaya yardımcı olur ve sorunları ve gerçek vakaları paylaşır.

Bir Genç Veri Bilimcisinin yapabilmesi gerekenler:

  • algoritmaları tasarlamak için temel algoritmik yapıları ve Python veri yapılarını kullanır;
  • Pandalar, Matplotlib, Seaborne kullanarak verileri görselleştirmek;
  • Veri Bilimi problemlerini çözmek için klasik makine öğrenimi ve sinir ağlarını kullanarak endüstriyel kalitede modeller oluşturmak;
  • modelin kalitesini değerlendirmek (kesinlik / geri çağırma);
  • çözümü genel olarak üretime ve işletmeye entegre etmek;
  • farklı türlerdeki veri ambarlarıyla çalışmak;
  • büyük veri analizi araçlarıyla çalışmak;
  • web kaynaklarından veya API aracılığıyla veri almak;
  • veri işleme için matematiksel analiz, doğrusal cebir, istatistik ve olasılık teorisi yöntemlerini uygular.

Eğer bu beceriler size çok zor geliyorsa Veri Bilimcisi Mesleği derslerini alabilirsiniz.

Veri bilimci kimdir ve ne yapabilmelidir?

Veri Bilimi özünde sıradakiVerilerle çalışırken insanlığın "evrimsel" adımı. Daha önceki matematikçiler ve istatistikçiler benzer problemleri çözdüler. Şimdi, yapay zekanın ortaya çıkmasıyla birlikte optimizasyon ve bilişim, veri analizi yöntemlerine girdi, bu da, verilere dayalı çözüm bulmaya yönelik yeni bir yaklaşımın önceki "analog" yöntemlerden çok daha etkili hale geldiği anlamına geliyor.

Bir veri bilimcinin işi toplamakla başlarbüyük veri kümeleri: yapılandırılmış ve yapılandırılmamış. Daha sonra okunması kolay bir biçime dönüştürülürler. Sonraki aşama: görselleştirme ve istatistiklerle çalışma. Makine ve derin öğrenme, olasılık analizi, öngörücü modeller ve sinir ağları analitik yöntemler olarak kullanılır.

Bir veri bilimcisi için beş temel

  • Yapay Zeka (AI) bir alandırinsan gibi çalışan ve hareket eden akıllı sistemler yaratmaya adanmış. Yapay zeka, insan zekasını anlamak için bilgisayarları kullanmanın benzer hedefiyle ilgilidir, ancak biyolojik olarak makul yöntemlerle sınırlı değildir. Günümüzde var olan akıllı sistemler çok dar uygulama alanlarına sahiptir. Örneğin, satrançta bir kişiyi yenebilen programlar soruları cevaplayamaz.
  • Makine öğrenme -verilerden bilgi çıkarmak için bir araç oluşturmak. Makine öğrenimi modelleri, bağımsız olarak veya aşamalı olarak veriler üzerinde eğitilir: bir kişi tarafından ve öğretmensiz hazırlanan veriler üzerinde bir öğretmenle eğitim - spontane, gürültülü verilerle çalışma.
  • Derin öğrenme -daha gelişmiş veya daha hızlı analizin gerekli olduğu ve geleneksel makine öğreniminin başarısız olduğu alanlarda çok katmanlı sinir ağları oluşturmak. "Derinlik", matematiksel hesaplamalar yapan ağdaki bir dizi gizli nöron katmanı tarafından sağlanır.
  • Büyük Veri - büyük ile çalışmakgenellikle yapılandırılmamış verilerin hacmi. Kürenin özgüllüğü, yüksek yüklere dayanabilecek aletler ve sistemlerdir.
  • Veri Bilimi - içindealanın özü, veri setlerinin güçlendirilmesi, görselleştirme, fikirlerin toplanması ve bu verilere dayalı karar verme sürecidir. Veri bilimcileri, makine öğrenimi ve Büyük Veri yöntemlerinden bazılarını kullanır: bulut bilgi işlem, sanal bir geliştirme ortamı oluşturmak için araçlar ve çok daha fazlası.

Diğer meslekler gibi, Verilere hakim olmakBilim temel bilgilerle başlar - matematik, doğrusal cebir ve tabii ki istatistik çalışmaları. Veri Biliminin ciddi bir şekilde anlaşılması için, gelecekteki bir uzmanın olasılık teorisinde (matematik dahil) gerçek bir üniversite kursuna ihtiyacı olacaktır. Neyse ki, bugün bu tür materyalleri internette bulmak kolaydır ve hatta Açık Öğretim platformunda Rusya'daki en iyi üniversitelerde bir dönem için kayıt olun. Veya yeni bir mesleğe hakim olmanın ilk adımı temel bilginin olacağı SkillFactory'de Veri Bilimi kursunun tamamını alın. Veri işleme algoritmalarını uygulamanın sonuçlarını analiz etmek için matematik bilgisi öncelikle önemlidir. Elbette, makine öğreniminde böyle bir eğitim olmadan güçlü mühendisler var. Ancak bunlar çoğunlukla nadir vakalardır.

Veri bilimcisi olmanın ikinci adımı programlamadır. Sözdiziminin tüm nüanslarına hakim olan en az bir dil öğrenmek yeterlidir. Yukarıda belirtildiği gibi, en çok talep gören dillerden biri Python'dur.

Makine öğrenimi - üçüncü bileşenVeri bilimci mesleği, artık belirli görevleri yerine getirmek için bilgisayarlara talimat yazması gerekmediğinde. Makine öğrenimi üç ana formdan oluşur: denetimli öğrenme, denetimsiz öğrenme ve pekiştirmeli öğrenme. Profesör Jan Lekun ile geniş materyalimizde her eğitim türü hakkında daha fazla bilgi edinebilirsiniz.

Ve son olarak, son adım Veri Madenciliği (analizveri) ve veri görselleştirme, maliyetleri düşürmek ve geliri artırmak için tasarlanmış iş kararlarını kolaylaştırmak için veri ambarlarında toplanan ve oluşturulan faydalı bilgilere dönüştürmeye yönelik çeşitli seçeneklere göre gizli veri modellerinin analizini içerir.

Eğitim alınabileceği gerçeğine rağmenOldukça kısa bir sürede, bir veri bilimcisinin, yüksek düzeyde uzmanlaşmış kurslar alarak, hackathonlara katılarak, açık yarışmalara katılarak ve iş yerinde arama yaparak niteliklerini düzenli olarak doğrulaması gerekir. Niteliklerinizin bağımsız olarak onaylanması bir avantaj olacaktır. Örneğin, bir sıralama sistemine sahip olan Kaggle'daki gelişmiş profil. Acemilikten büyük usta olmaya gidebilirsiniz. Yarışmalara, senaryoların ve tartışmaların yayınlanmasına başarılı bir şekilde katılmak için puanınızı artıran puanlar alırsınız. Ayrıca site, hangi yarışmalara katıldığınızı ve sonuçlarınızın ne olduğunu not eder.

uygulamak

Ayrıca bakınız:

Perseverance gezgininin şimdi nereye uçtuğunu görün

Çocuklarda koronavirüs belirtileri. Neye dikkat etmelisiniz?

Gökbilimciler bir kara deliğin titreşen gama ışınlarını nasıl yaydığını görüyor