Ir para o conteúdo

JupyterHub

O JupyterHub é um ambiente de desenvolvimento multiusuário baseado em iPython Notebooks que oferece acesso a recursos computacionais compartilhados em um servidor remoto, sem a necessidade de instalação e manutenção por parte dos usuários. Os únicos pré-requisitos para acessar o JupyterHub são: ter uma conta de usuário no LIneA (veja aqui como criar sua conta) e um navegador com acesso à Internet. Os chamados Jupyter Notebooks permitem combinar código interativo, resultados de execução, texto explicativo e recursos de multimídia em um só documento.

Como parte do LIneA Science Platform, o LIneA JupyterHub está integrado às demais ferramentas de visualização (Science Server) e acesso a dados (User Query). Desse modo, toda a análise de dados pode ser feita online dentro da plataforma, desde a leitura, visualização, processamento e análise de resultados, sem a necessidade de download dos dados.

Ao clicar no card "JupyterHub" dentro do LIneA Science Platform, você será direcionado para a página de login e em seguida para a página inicial do JupyterHub que mostrará o seu perfil de usuário. Clique no botão START para iniciar.

A instalação padrão do JupyterHub utiliza a nova interface JupyterLab e é baseada na imagem datascience-notebook. Isto significa que uma série de bibliotecas Python de grande popularidade como Astropy, Numpy e Matplotlib estarão automaticamente disponíveis.

Apoio ao usuário

Tutoriais em Jupyter Notebooks

No repositório jupyterhub-tutorial você encontrará os tutoriais em formato notebook:

1-primeiros-passos.ipynb

Instruções gerais de uso da plataforma JupyterLab, dicas e atalhos na escrita de notebooks para diferentes tipos de células.

2-acesso-a-dados.ipynb

Instruções para uso da biblioteca dblinea para leitura de dados a partir do banco de dados diretamente de dentro de uma célula no notebook com exemplo de uso (construção de um diagrama cor-magnitude simples para uma amostra de estrelas).

3-conda-env.ipynb

Instruções para criação de ambientes no conda para gerenciamento de bibliotecas que sejam persistentes e sobrevivam a destruição e recriação dos containers para que os usuários possam retornar em uma nova sessão e encontrar o mesmo ambiente da sessão anterior (não disponível para usuários de perfil público bronze).

Para acessar os notebooks, basta abrir um Terminal no JupyterLab clicando no botão "+" na barra superior e em seguida no ícone "Terminal" da seção "Other" na aba "Launcher", e inserir o comando:

git clone https://github.com/linea-it/jupyterhub-tutorial.git

Recursos computacionais

Configurações disponíveis para o Jupyter over K8S

Após efetuar login na plataforma, será exibido um menu com até três opções de configuração. Basta selecionar e clicar em Start My Server.

Tamanho CPUs RAM
Small 1.0 4 GiB
Medium 2.0 8 GiB
Large 4.0 16 GiB

Configuração dos servidores do ambiente K8S

A plataforma Jupyter é executada sobre o Kubernetes (K8S) e possui 12 servidores físicos dedicados. Cada máquina é equipada com os seguintes recursos computacionais:

Kubernetes Node Configuration
RAM 64 GB
Thread(s) per core 2
Core(s) per socket 6
Socket(s) 2

Jupyter over K8S vs Jupyter over HPC

O LIneA disponibiliza dois ambientes separados de Jupyter Notebook. O primeiro é executado em containers na plataforma Kubernetes (K8S). O segundo está disponível na plataforma Ondemand e acessa diretamente a infraestrutura de HPC.


Última atualização: 30 de abril de 2025