杰瑞科技汇

Python Notebook如何高效使用?

我会从基础到进阶,分步为你介绍,包括:

Python Notebook如何高效使用?-图1
(图片来源网络,侵删)
  1. 什么是 Python Notebook?
  2. 安装与启动
  3. 核心界面介绍
  4. 基本操作
  5. 高级技巧
  6. 常用快捷键
  7. 保存与分享
  8. 本地 vs. 云端 (Jupyter vs. Colab)

什么是 Python Notebook?

你可以把它理解为一个“交互式的代码文档”,它将你的代码、代码的输出(比如图表、数字、文本)和解释性文字(Markdown)都整合在一个网页格式的文档中。

主要特点:

  • 交互式执行:你可以逐块(Cell by Cell)运行代码,而不是一次性运行整个脚本,这对于数据探索和调试非常方便。
  • 可视化:代码的输出(如 matplotlib 生成的图表、pandas 的数据表格)会直接显示在代码块下方,一目了然。
  • 文档化:你可以用 Markdown 格式写下标题、说明、公式、图片等,将你的分析过程和结果清晰地记录下来,形成一个完整的报告。
  • 易于分享:一个 .ipynb 文件就可以包含你的全部工作,方便与他人分享和协作。

安装与启动

安装 Anaconda(强烈推荐新手)

Anaconda 是一个 Python 和 R 的科学计算发行版,它自带了 Jupyter Notebook、Spyder IDE 以及几百个常用的数据科学库(如 NumPy, Pandas, Matplotlib),省去了很多环境配置的麻烦。

  1. 下载:访问 Anaconda 官网 下载适合你操作系统的安装包。
  2. 安装:按照提示进行安装,安装时务必勾选 "Add Anaconda to my PATH environment variable"
  3. 启动
    • 安装完成后,在开始菜单或应用程序文件夹中找到 "Anaconda Navigator"
    • 打开 Navigator,你会看到各种工具,点击 "Launch" 按钮,即可启动 Jupyter Notebook。

使用 pip 安装

如果你已经有一个 Python 环境,可以直接安装 Jupyter。

Python Notebook如何高效使用?-图2
(图片来源网络,侵删)
  1. 打开终端/命令行
    • Windows: cmdPowerShell
    • macOS/Linux: Terminal
  2. 安装
    pip install notebook
  3. 启动
    jupyter notebook

启动后,你的浏览器会自动打开一个新标签页,显示 Jupyter 的文件管理界面。


核心界面介绍

启动 Jupyter Notebook 后,你会看到这样的界面:

  • 顶部工具栏:包含保存、添加单元格、剪切、复制、粘贴、运行、停止、重启等常用操作按钮。
  • 左侧文件浏览器:显示你当前工作目录下的文件和文件夹,你可以在这里创建新的 Notebook 或其他文件。
  • 主区域(Notebook 编辑区):这是核心区域,由多个单元组成。

Cell(单元格)是 Notebook 的基本组成单位,分为两种类型:

  1. Code(代码)单元格

    Python Notebook如何高效使用?-图3
    (图片来源网络,侵删)
    • 用途:编写和运行 Python 代码。
    • 外观:左侧有 In [ ]: 的提示符。
    • 运行:按 Shift + Enter 或点击工具栏的 "Run" 按钮,运行后,下方会显示输出 Out [ ]:
  2. Markdown(文本)单元格

    • 用途:编写说明文档、标题、列表、公式等。
    • 外观:左侧没有 In [ ]:
    • 使用:像写 Markdown 一样输入文本,然后按 Shift + Enter 或点击 "Run" 按钮将其渲染成格式化的文本。

基本操作

A. 创建和编辑 Notebook

  1. 在文件浏览器界面,点击右上角的 "New" 按钮,然后选择 "Python 3" (或你安装的其他 Python 版本),一个新的、空白的 Notebook 就会被创建并打开。
  2. 默认情况下,第一个单元格是 "Code" 单元格。

B. 单元格的基本操作

  • 运行单元格:选中单元格,按 Shift + Enter,这会运行当前单元格,并自动选中下一个单元格。
  • 插入单元格
    • 在工具栏点击 (Insert Cell)。
    • 或者,选中一个单元格,按 A (Above) 在其上方插入,按 B (Below) 在其下方插入。
  • 删除单元格:选中单元格,按两次 D (快速连续按)。
  • 更改单元格类型
    • 选中单元格。
    • 在工具栏的下拉菜单中选择 "Code" 或 "Markdown"。
    • 或者,使用快捷键 Y 将其设为 Code,M 将其设为 Markdown。
  • 编辑和查看
    • 编辑模式:单元格边框为绿色,可以输入代码或文本。
    • 命令模式:单元格边框为蓝色,可以对单元格进行整体操作(如复制、粘贴、删除)。
    • Enter 进入编辑模式,按 Esc 进入命令模式。

高级技巧

A. 使用魔法命令

在代码单元格的开头加上 或 可以启用一些特殊功能,极大地提升效率。

  • %matplotlib inline:在 Jupyter Notebook 中直接显示图表,无需调用 plt.show()
    %matplotlib inline
    import matplotlib.pyplot as plt
    plt.plot([1, 2, 3, 4])
    plt.show() # 这行其实可以省略
  • %time%%time:测量单行代码或整个单元格的执行时间。
    %time sum(range(1000000))
    %%time
    # 测量整个单元格
    a = [i**2 for i in range(10000)]
    b = [i**3 for i in range(10000)]
  • 在 Notebook 中执行系统命令。
    !ls  # 列出当前目录文件 (Linux/macOS)
    !dir # 列出当前目录文件 (Windows)
  • %who%whos:查看当前命名空间中的变量。
    x = 10
    y = "hello"
    %whos 

B. 导入数据

通常使用 pandas 库来读取数据,如 CSV, Excel 文件。

import pandas as pd
# 假设你有一个 data.csv 文件在当前目录下
df = pd.read_csv('data.csv')
# 显示前5行数据
df.head()

C. 绘图

使用 matplotlibseaborn 进行数据可视化。

import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
# 创建一些示例数据
data = np.random.randn(100)
# 绘制直方图
plt.figure(figsize=(10, 6))
plt.hist(data, bins=20, color='skyblue', edgecolor='black')'My First Plot in Jupyter')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.show()

常用快捷键(提升效率的关键)

快捷键 模式 功能
Shift + Enter 编辑 运行当前单元格,并选中下一个
Ctrl + Enter 编辑 运行当前单元格,并保持选中
Alt + Enter 编辑 运行当前单元格,并在下方插入一个新单元格
Esc 编辑 进入命令模式
Enter 命令 进入编辑模式
A 命令 在上方插入新单元格
B 命令 在下方插入新单元格
D, D 命令 删除当前单元格
Z 命令 撤销删除单元格
C 命令 复制当前单元格
X 命令 剪切当前单元格
V 命令 粘贴单元格
M 命令 将单元格转换为 Markdown
Y 命令 将单元格转换为 Code
H 命令 显示所有快捷键帮助

保存与分享

  • 保存:点击工具栏的 "Save and Checkpoint" 图标(软盘图标),你的 Notebook 会以 .ipynb 的格式保存,这个文件是 JSON 格式的,包含了所有代码、输出和文本。
  • 分享
    1. 直接分享 .ipynb 文件:最简单的方式,但接收者也需要有 Jupyter 环境才能打开。
    2. 导出为其他格式:通过 File -> Download as,可以导出为 HTML(可分享的网页)、PDF(需额外配置)、Markdown 等。
    3. 上传到 GitHub:GitHub 对 .ipynb 文件有很好的原生支持,可以直接在线渲染。

本地 vs. 云端 (Jupyter vs. Colab)

特性 Jupyter Notebook (本地) Google Colab (云端)
环境 在你自己的电脑上运行 在 Google 的服务器上运行
优点 - 数据安全,不联网
- 完全控制环境和硬件
- 适合处理大型、敏感数据
- 免费使用 GPU/TPU (对深度学习至关重要)
- 无需任何配置,开箱即用
- 方便协作,可分享链接
- 自动保存到 Google Drive
缺点 - 需要自己安装和配置环境
- 没有免费 GPU/TPU
- 数据隐私问题
- 有使用时间限制
- 网络依赖性强

何时使用哪个?

  • 日常学习、数据探索、机器学习项目(尤其是需要 GPU/TPU 的):首选 Google Colab
  • 处理敏感数据、进行大规模生产任务、需要特定环境配置:选择 本地 Jupyter Notebook

希望这份详细的指南能帮助你顺利上手 Python Notebook!多加练习,你会发现它是一个极其强大的工具。

分享:
扫描分享到社交APP
上一篇
下一篇