Datalore Enterprise 2021.3 - data science платформа для спільної роботи з Jupyter-ноутбуками
Datalore Enterprise 2021.3 - платформа для науки про дані для співпраці з ноутбуками Jupyter
Datalore Enterprise — це платформа для науки про дані для співпраці з ноутбуками Jupyter. Його можна встановити в приватній хмарі або на приватному сервері компанії.
Нова версія 2021.3 дозволяє data scientists працювати з базами даних і SQL-кодом всередині ноутбуків Jupyter, а також легко ділитися результатами роботи з колегами. Також ми інтегрували підтримку ноутбуків R і Scala, додали новий реактивний режим, реалізували конструктори діаграм і багато інших функцій.
Що нового в Datalore Enterprise 2021.3
Підключіться до бази даних з редактора і запустіть нативний SQL код
Підключення до бази даних з ноутбуків
Нова версія Datalore Enterprise дозволяє безпосередньо підключати ноутбуки Jupyter до баз даних всього в кілька кліків. Створивши підключення, можна переглядати схему таблиці та отримувати дані за допомогою комірок SQL, не передаючи пароль підключення до середовища.
Datalore Enterprise підтримує автентифікацію користувача/пароля для Amazon Redshift, бази даних Azure SQL, MariaDB, MySQL, Oracle, PostgreSQL, Snowflake тощо.
Клітини SQL
Ви можете використовувати власні клітини SQL для вивантаження даних з бази даних. Вони підтримують підсвічування синтаксису і заповнення коду на основі самоаналізу таблиць бази даних. Результат запиту автоматично передається в pandas DataFrame, після чого можна приступати до аналізу даних за допомогою Python.
Перетворення ноутбуків Jupyter на інтерактивні звіти
Щоб візуалізувати результати своєї роботи з даними, іноді доводиться сильно постаратися. Просто ділитися ноутбуком Jupyter не завжди зручно, так як в ньому занадто багато коду, в тому числі і для проміжних етапів аналізу. Збирання приладної дошки в Tableau займає занадто багато часу, а слайди Powerpoint вимагають ручного оновлення з будь-якими змінами в результатах аналізу.
Datalore Enterprise пропонує вихід – публікуйте інтерактивні звіти!
Публікування інтерактивних звітів
Тепер ви можете швидко перетворити свій ноутбук в інтерактивний звіт. Ви можете поділитися інтерактивними звітами тут. Зробивши це, можна приховати клітинки коду, які не потрібні для презентації.
Працювати з ним зможе і кожен, хто отримає посилання на звіт - змінити елементи управління і запустити відповідний ноутбук.
Конструктори діаграм, розкривні списки та інші інтерактивні елементи
Щоб зробити ноутбуки та звіти інтерактивнішими, ми додали нові типи клітинок:
- Ви можете додавати розкривні списки, повзунки та текстові поля до ноутбуків, а також призначати значення вводу змінним.
- Розкривні списки в Datalore
- Ви можете легко створювати графічні відображення за допомогою конструкторів графіків у клітинках діаграм. Це дозволить оновити стан осередків для інших користувачів, які редагують ваш ноутбук, а значить, ви зможете працювати над візуалізацією разом.
Настроювання параметрів видимості клітинок
Надаючи доступ до ноутбуків або звітів, можна приховати певні дані, щоб не перевантажувати користувача інформацією. У новій версії Datalore ви можете приховати будь-яку комірку, а також вибіркові входи і виходи.
Створення ноутбуків R і Scala
Додано підтримку мов R і Scala. Тепер для них можна використовувати розумне автозаповнення. Менеджер пакетів conda також доступний для R.
Реактивний режим для відтворюваних обчислень
Останні три роки ми експериментуємо з вирішенням проблеми відтворюваності ноутбуків. Сьогодні ми раді представити новий реактивний режим!
Коли ви вмикаєте реактивний режим, Datalore обчислює клітинки коду зверху вниз, а коли ви змінюєте клітинку, автоматично переобчислює всі клітинки нижче.
Інші вдосконалення
Скрипти ініціалізації
Крім можливості налаштовувати базові середовища і встановлювати бібліотеки через менеджер пакетів, тепер можна додавати спеціальні настройки в скрипт, який запускається до старту ноутбука. Усередині init.sh ви можете вказати всі інструменти збірки та залежності, необхідні для вашого ноутбука.
Підтримка версій Python 3.6+
У Datalore Enterprise 2021.3 ви можете вибрати з безлічі версій Python (3.6 і новіших версій) і скористатися можливостями аналізу розумного коду Datalore для будь-якої з них. Просто заздалегідь налаштуйте кілька базових середовищ, і ваша команда зможе перемикатися між різними версіями Python всього за кілька кліків.
Нові діаграми на вкладці "Візуалізація"
Якщо результатом виконання коду є pandas DataFrame, datalore автоматично відобразить отримані графіки на вкладці Visualize. Додана підтримка:
- Точкові сюжети
- Барні ділянки
- Площа ділянок
- Графіки кореляції
Крім того, тепер ви можете налаштувати колір графіка на основі певних значень стовпців.
Монтаж ковшів ГКС
На додаток до сегментів AWS S3, тепер ви також можете монтувати сегменти Google Cloud Storage у своєму ноутбуці. Для цього достатньо вказати ім'я сегмента і вміст файлу аутентифікації .json - змонтований ківш буде відображатися у вигляді окремої папки.
Відомості про останній початок клітинки
Навівши курсор на час виконання комірки, ви побачите повну дату останнього виконання.
Згортання клітинок
Щоб зосередитися на написанні коду, тепер можна згорнути будь-який вхід і вихід.
Спробуйте безкоштовно!
Ви можете спробувати Datalore Enterprise безкоштовно протягом 30 днів.
