Jupyter-ноутбуки применяют для визуализации данных в big data и data science.
Jupyter notebook — веб-приложение с открытым исходным кодом. Каждый разработчик может разбить в нем код на куски и работать над ними в произвольном порядке: писать и проверять функции, загружать файл в память и обрабатывать содержимое. Рассказываем, как написать свой первый код уже сегодня.
Jupyter-ноутбук — интерактивная среда разработки с «живым» кодом. В ней показана визуализация работы. Если разработчик хочет посмотреть на график или формулу, он пишет нужную команду в соответствующей ячейке. Такой подход экономит время и помогает избежать ошибок.
Чаще всего jupyter-ноутбуки применяют в машинном обучении, например, при подготовке нейросетей. Еще их используют специалисты по data science и начинающие программисты на Python.
Научитесь писать чистый и стабильный код на Python на курсе от онлайн-университета Skypro. У вас будет 400 часов теории и практики, 4 проекта в портфолио. Смотрите 40-минутные видеолекции в любое удобное время и выполняйте практические задания с реальными инструментами разработчика. На вопросы ответит наставник — в чате или на еженедельных вебинарах. В конце получите диплом о переподготовке и пожизненный доступ к курсу.
Jupyter — преемник проекта IPython Notebook. Сегодня jupyter-ноутбуки умеют работать не только с Python. Появились ядра и для других языков. Например:
У каждого ядра есть отдельная инструкция по установке. Для запуска кода на другом языке используют специальные magic-команды. Они расширяют функционал Python.
Jupyter-ноутбук запускают на любом сервере с доступом по ssh или http.
Запуск на компьютере. Для работы с ноутбуком нужен Python с загруженной библиотекой Jupyter. Чтобы установить программу, введите в окно терминала следующую команду:
pip3 install jupyter
Это активирует установочную утилиту — pip. Ее задачи — распаковывать, устанавливать и обновлять пакеты программ.
Другой способ запустить ноутбук на компьютере — загрузить Anaconda. Это архивированный набор файлов с полезным софтом: Python, Jupyter, NumPy, pandas, Matplotlib.
Запуск в облаке. Если хотите настрочить код здесь и сейчас, запустите ноутбук в облаке. С сервисами по типу Google Colab пишут на Python в любом браузере. Никаких специальных настроек не требуется — следуйте указаниям и создавайте код.
Минус такого подхода: программы на локальном сервере работают быстрее облачных. Кроме того, у последних ограниченный набор библиотек. Если понадобятся дополнительные ресурсы, весь проект пойдет насмарку.
Создайте новый блокнот — так называется проект в Jupyter.
Запуск Jupyter. Используйте команду: jupyter notebook. Она откроет новую вкладку в браузере и запустит программу. URL-адрес приложения будет выглядеть так: https://localhost:8888/tree.
Интерфейс Notebook. Все блокноты в каталоге помечены иконкой записной книжки. Чтобы создать новый, выберите в верхнем меню команды «New» → «Python 3». Рядом с логотипом Jupyter появится надпись Untitled. Это название блокнота.
Создание блокнота в Jupyter Notebook
Каждый блокнот использует новую вкладку — открывайте хоть сотню проектов одновременно. Чтобы найти все рабочие блокноты, нажмите вкладку «Running». У запущенных в работу проектов будет зеленая иконка, у нерабочих — серая.
Ячейки (Cell). Откройте новый блокнот. Поле с зеленым контуром и надписью In [ ] — это ячейка со строкой ввода. Зеленый контур означает, что ячейка — в режиме редактирования.
Редактирование ячейки в Jupyter Notebook
Ячейки — это ДНК ноутбука. Они делятся на кодовые и markdown.
Напишите выражение вывода, используя синтаксис Python 3. Нажмите «Run». Поздравляем, вы только что создали свой первый фрагмент кода!
Ячейки в Jupyter Notebook
Обратите внимание: In [ ] преобразовалось в In [1]. Это порядковый номер запуска ячейки. Синий контур означает командный режим. Первая ячейка в блокноте всегда кодовая.
Чтобы создать новую ячейку, нажмите «+» на панели инструментов. Вырезайте, копируйте, удаляйте и редактируйте ячейки с помощью вкладки Edit.
Горячие клавиши. Куда же без них! Полный список хоткеев — в разделе Help → Keyboard Shortcuts.
Горячие клавиши в Ячейки в Jupyter Notebook
Markdown. Это язык разметки текстов. Его используют для комментариев, заголовков и списков. А еще для конвертации текстов в формат HTML. Чтобы перейти в ячейку Markdown, нажмите раздел Code и выберите команду Markdown.
Заголовки создают с помощью символа «#». Один такой символ сделает крупный заголовок верхнего уровня, два — заголовок поменьше. Вот так:
# <h1>
## <h2>
### <h3>
#### <h4>
##### <h5>
###### <h6>
Cимвол «*» с двух сторон текста нужен для курсива. Два таких символа — для полужирного выделения. Списки создают при помощи тире и пробела для каждого пункта.
Разметка текстов Markdown
Ядра (Kernel). Ядро — вычислительный движок, который выполняет записанный код. Этот механизм контролирует все вычисления. Когда вы открываете новый блокнот и запускаете ячейку с кодом, ядро отображает вывод на экран. Каждый язык программирования использует отдельное ядро. Например, код Python — ipython.
Чтобы увидеть основные команды для ядра, зайдите во вкладку Kernel:
Начнем писать код и посмотрим, что из этого получится.
Название. Сначала дадим проекту имя. Поскольку мы тренируемся, назовем блокнот Test. Для этого зайдем во вкладку «File» и выберем команду «Rename». Либо дважды щелкнем по самому заголовку.
Название проекта в Jupyter Notebook
Настройка. Первой настраиваем ячейку для импорта. Если мы хотим загрузить новые файлы, добавим их в режиме редактирования и перезапустим ячейку. Введем следующие команды:
import pandas as pd
import matplotlib.pyplot as plt
%pylab inline
Мы импортировали pandas для анализа данных и matplotlib для визуализаций. Команда %pylab inline нужна, чтобы дать ядру отмашку на использование графиков.
Сохранение и контрольная точка. Посмотрим на панель инструментов:
Панель инструментов в Jupyter Notebook
Верхняя левая иконка — команда «Сохранить контрольную точку» (Ctrl + S). Контрольная точка — текстовый файл. В нем — содержимое блокнота в формате JSON. Данные обновляются при каждом новом сохранении. То есть контрольная точка — это резервное хранилище на случай форс-мажоров. Например, если по клавиатуре внезапно пробежит кот.
Изучение набора данных. Создадим новый проект на основе реальных данных — показаний космического телескопа «Хаббл». Ячейка для импорта у нас уже настроена. Осталось загрузить таблицу.
data = pd.read_csv(“hubble_data.csv”) data.head()
Как видите, прочесть файл csv можно с помощью одной команды: read_csv(). Следующая — head() выводит данные на экран. По умолчанию функция head() показывает только первые пять строк. Нам нужно больше. Поэтому преобразуем команду в head(25), где 25 — искомое число.
Pandas — умная библиотека. Она распознает заголовки и отображает эти данные в ячейке. Если заголовков нет, пропишите их в коде
headers = [“dist”,”rec_vel”]
data_no_headers = pd.read_csv(“hubble_data_no_headers.csv”, names=headers)
— пишем код в одну строчку.
data_no_headers.head()
Headers — наши собственные заголовки. Команда names=headers сообщает Pandas, что нужно использовать именно их.
У нас получилась следующая таблица:
Таблица для построения графика
Графики. Теперь все готово к тому, чтобы построить график. Первым делом избавимся от индексов в первой колонке:
data.set_index(“distance”, inplace=True) data.head()
Наша таблица приобрела следующий вид:
Таблица без индексов в первой колонке
Теперь данные легко представить в виде соотношений осей x и y. Задаем необходимые команды:
data.plot() plt.show()
И любуемся полученным графиком:
График показаний телескопа «Хаббл»
Рассказываем про «Тинькофф», «Билайн» и другие компании.
Указывайте в отчете только одну ошибку, прикладывайте скрины, сообщения и коды.
Учимся добавлять и изменять элементы, объединять и копировать списки.
Конструкция, чтобы много раз выполнять один и тот же участок кода.
JSON часто применяют, когда разрабатывают API и веб-приложения.
Есть сервисы, платформы и телеграм-каналы с вакансиями по всему миру.
С помощью HTML структурируют страницу на сайте, добавляют картинки, таблицы, списки.
Цикл for используют, когда количество повторов известно заранее.
Есть комьюнити на платформах, под эгидой компаний или самоорганизующиеся.
Обязанности и зарплата аналитика, Python- и Java-разработчиков и не только.
Правильное питание — это не о жестких диетах и полном отказе от любимых продуктов.
Благодаря методу «круга-пирога» увидите свое время и возьмете его под контроль.
Ищите мотивацию, хвалите себя, визуализируйте план и результат.
Лягушки — небольшие, но неприятные дела, слоны — долговременные задачи.
Когда ставите цель, отталкивайтесь от проблемы и конкретизируйте решение.
Этот специалист контролирует все этапы проекта и приводит его к успеху.
Советы всем удаленщикам — больше двигаться, делать зарядку, разминку для глаз.
Junior зарабатывает от 40 000 ₽, Middle от 100 000 ₽, а Senior от 250 000 ₽ и выше.
Совет от героини: сделайте первый шаг, дальше будет проще; учитесь и идите вперед.
Фишки и стоимость Forest, WaterDo, SleepTown, Alarmy, Pomodoro Timer Lite.
Программист fullstack получает до 550 000 ₽, а на тестировщика учатся 4–15 мес.
SQL используют в банках, торговле, перевозках: везде, где много информации.
Сначала поставьте цель: выберите сферу и определите, кем видите себя через 10 лет.
Термины разработки, Scrum, неформального общения, организационных процессов.
Узнаете о работе программиста и поймете, как писать хороший код.
Мозг меняется всю жизнь. Мы можем на него влиять: изучать новое, развивать навыки.
Помогает планирование, вера в то, что реально изменить жизнь, поддержка семьи.
С помощью CSS задают цвет, размеры, анимацию, адаптируют сайт под устройства.
Python — самый популярный язык программирования в феврале 2022 года.
Гуманитарию подойдут профессии тестировщика, веб-дизайнера и не только.
Фронтендер создает интерфейс продукта, бэкендер работает с серверной частью.
Обязанности Java-разработчика — писать код, тестировать и улучшать его.
IT-отрасль привлекает удаленкой, карьерным ростом, высоким доходом.
Воспользуйтесь Google Colab, онлайн-интерпретаторами или скачайте Python.
Используйте конструкторы no-code, Java или Kotlin, Android Studio.
Бесплатный сервис позволяет писать тесты, поддерживает разные типы API.
Colab используют, чтобы создавать код на Python прямо в браузере.
Освоить новую профессию реально с нуля в любом возрасте, главное — мотивация.
Не выбирайте по принципу «чем проще, тем лучше» и уважайте желания ребенка.
Важнее опыт и проекты в портфолио, но иногда высшее образование все-таки нужно.
Сегодня удаленка доступна для разных сфер: ИТ, маркетинг, сервис, продажи.
Выбирайте по уровню спроса у работодателей и направлению в программировании.
20 фильмов и сериалов для тех, кому интересен мир информационных технологий.
Frontend-разработчик создает внешнюю — пользовательскую часть веб-ресурса.
Backend-разработчик отвечает за внутреннюю — серверную сторону веб-ресурса.
Спринты используют в долгих проектах и сложных продуктах.
Преимущества Python — понятный синтаксис и читаемость, готовые библиотеки.
Soft skills помогают развивать компетенции, осваивать новые тенденции в работе.
На Java разрабатывают всё: от приложений и ПО до технологий Big Data.