入门

本篇带你装上 PDF.js（pdfjs-dist）并完成第一次「加载 → 渲染一页到 canvas」。版本基线 6.0.x。核心认知：getDocument → getPage → getViewport → render 四步链路，外加一条贯穿全篇的前置提醒——先配 GlobalWorkerOptions.workerSrc，否则 worker 缺失会报错。

速查

安装：npm i pdfjs-dist（包名是 pdfjs-dist，不是 pdf.js）
导入：import * as pdfjsLib from "pdfjs-dist"
配 worker（必做）：pdfjsLib.GlobalWorkerOptions.workerSrc = new URL("pdfjs-dist/build/pdf.worker.mjs", import.meta.url).toString()
加载：const pdf = await pdfjsLib.getDocument({ url }).promise
取页（1 基）：const page = await pdf.getPage(1)
算尺寸：const viewport = page.getViewport({ scale: 1.5 })
渲染：await page.render({ canvas, viewport }).promise
总页数：pdf.numPages；释放：await pdf.destroy()
⚠️ PDF.js 只渲染/解析，不生成 PDF（生成用 jsPDF / pdf-lib）

一、PDF.js 是什么

官方定位：「a general-purpose, web standards-based platform for parsing and rendering PDFs」。三个关键点：

解析 + 渲染：把已有 PDF 画到 canvas、抽文本、读元数据；不创建 PDF。
worker 架构：CPU 密集的解析放后台线程，主线程只绘制。
分层设计：core（解析）/ display（渲染 API，最常用）/ viewer（完整 UI）。

边界提醒：要「生成 PDF」请用 jsPDF（编程式画）或 pdf-lib（改/拼现有 PDF）。把 PDF.js 当生成器是最常见的误解。

二、安装与导入

bash

npm i pdfjs-dist
# pnpm add pdfjs-dist / yarn add pdfjs-dist 同理

import * as pdfjsLib from "pdfjs-dist";

pdfjsLib.getDocument(/* ... */);
pdfjsLib.GlobalWorkerOptions.workerSrc = /* ... */;

新版 pdfjs-dist（v4/v5/v6）以 ES Module 为主：入口 build/pdf.mjs、worker build/pdf.worker.mjs。老浏览器或 Node 用 legacy 构建（pdfjs-dist/legacy/build/...）。

三、配置 worker（绕不开的一步）

PDF.js 把解析放进 Web Worker，使用前必须告诉它 worker 脚本在哪：

// 推荐：交给打包器（Vite/webpack）解析资源 URL
pdfjsLib.GlobalWorkerOptions.workerSrc = new URL(
  "pdfjs-dist/build/pdf.worker.mjs",
  import.meta.url,
).toString();

不配会怎样

不设 workerSrc 通常报错，或退化成「fake worker」在主线程解析——卡 UI 且常出问题。另外主库与 worker 版本必须一致，否则报「The API version does not match the Worker version」。

四、第一次「加载」

getDocument 返回的是加载任务，文档要从它的 .promise 拿：

const url = "/files/demo.pdf";
const loadingTask = pdfjsLib.getDocument({ url });
const pdf = await loadingTask.promise; // PDFDocumentProxy

console.log(pdf.numPages); // 总页数

这种「先给任务、再 await promise」的设计，是为了支持进度回调（loadingTask.onProgress）、取消等。

五、第一次「渲染一页」

标准四步：取页 → 算 viewport → 备 canvas → render。

// 1. 取第 1 页（页码 1 基！）
const page = await pdf.getPage(1);

// 2. 按缩放算出该页像素尺寸与变换
const scale = 1.5;
const viewport = page.getViewport({ scale });

// 3. 用 viewport 尺寸准备 canvas
const canvas = document.getElementById("the-canvas") as HTMLCanvasElement;
const context = canvas.getContext("2d")!;
canvas.width = Math.floor(viewport.width);
canvas.height = Math.floor(viewport.height);

// 4. 渲染（render 返回 RenderTask，await 其 .promise）
await page.render({ canvas, viewport }).promise;

新版推荐直接传 canvas 元素；旧写法传 canvasContext（2D 上下文）仍兼容。render() 返回 RenderTask，其 .promise 完成、.cancel() 取消。

六、高分屏（Retina）不糊

官方示例用 devicePixelRatio 提升画布物理像素，CSS 尺寸保持视口大小：

const viewport = page.getViewport({ scale: 1.5 });
const outputScale = window.devicePixelRatio || 1;

canvas.width = Math.floor(viewport.width * outputScale);
canvas.height = Math.floor(viewport.height * outputScale);
canvas.style.width = Math.floor(viewport.width) + "px";
canvas.style.height = Math.floor(viewport.height) + "px";

const transform =
  outputScale !== 1 ? [outputScale, 0, 0, outputScale, 0, 0] : null;

await page.render({ canvas, viewport, transform }).promise;

七、一个易忘点：纯 render 的文字不能选

canvas 渲染产出的是位图像素，文字是「画上去的图」，无法被鼠标选中或搜索。要可选中/可搜索，需另建文本层（getTextContent + TextLayer，见指南 · 进阶）。

const textContent = await page.getTextContent();
// textContent.items[].str 是文本片段；transform 是其位置

跑通加载与渲染后，进入指南 · 基础：渲染链路与对象模型（loadingTask / PDFDocumentProxy / PDFPageProxy）、viewport 与 scale、RenderTask 的取消。

网络层及以下

应用层

移动网络

CommonJS

指南

ES Module

指南

npm

指南

pnpm

指南

yarn

指南

bun

指南

Lodash-es

指南

es-toolkit

指南

Day.js

指南

date-fns

指南

Luxon

指南

axios

指南

ky

指南

ofetch

指南

Zod

指南

Valibot

指南

Immer

指南

RxJS

指南

nanoid

指南

type-fest

指南

ts-pattern

指南

DOMPurify

指南

decimal.js

指南

PapaParse

指南

Fuse.js

指南

前端实用小库

指南

crypto-js

指南

React

指南

Vue

指南

Angular

指南

Svelte

指南

Solid

Lit

Alpine.js

HTMX

Preact

Next.js

指南

Nuxt

指南

Astro

指南

Qwik

React Router

SolidStart

SvelteKit