极限与连续性基础

一句话概述

极限是微积分的基石，它描述的是函数值随着自变量逼近某个点时的趋势——而不是精确到达那个点的值。连续性则刻画了函数图像是否"一笔画成"、没有断裂。这两个概念是理解导数、积分、梯度下降等所有高阶微积分工具的必备前提。在AI领域，极限思想贯穿模型训练的收敛性分析，而连续性保证了损失函数可以被平滑优化。

💡 核心要点：①极限是"无限接近"而非"等于"的数学表述 ②ε-δ语言是极限的精确化工具 ③连续函数就是"没有洞的函数" ④极限是理解梯度收敛和训练稳定性的理论根基

教学与演示

一、极限是什么——无限逼近的思想

是什么（定义，可选）：设 f(x) 在点 a 的某去心邻域内有定义。若存在常数 L，使得当 x 无限接近 a 时，f(x) 无限接近 L，则称 L 为 f(x) 当 x→a 时的极限，记作 limₓ→ₐ f(x) = L。

大白话 想象你朝一堵墙走去，每一步只走剩下距离的一半——你永远走不到墙，但你可以无限接近它。极限描述的就是这种"无穷靠近但可能永远达不到"的状态。

为什么（原理，可选）：极限是处理无穷问题的唯一精确工具。无论是瞬时速度、曲线下的面积，还是无限级数的求和，它们本质上都是极限问题。没有极限的严格定义，牛顿和莱布尼茨的微积分就缺乏逻辑基础。19世纪的柯西和魏尔斯特拉斯用ε-δ语言给出了极限的精确定义，使得微积分从此有了牢不可破的数学根基。 怎么做（实现，可选）：

import numpy as np
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt

# 演示函数 f(x) = (x^2 - 1)/(x - 1) 在 x→1 时的极限
# 该函数在 x=1 处无定义，但当 x 趋近 1 时，极限存在且等于 2

def f(x):
    """待考察极限的函数，x=1 处未定义"""
    # 使用 np.where 避免除零警告
    return np.where(np.abs(x - 1) > 1e-10, (x**2 - 1) / (x - 1), np.nan)

# 生成逼近点 x=1 的序列
# 从左逼近和从右逼近分别采样
x_left = np.array([0.9, 0.99, 0.999, 0.9999, 0.99999])  # 左逼近序列
x_right = np.array([1.1, 1.01, 1.001, 1.0001, 1.00001])  # 右逼近序列
y_left = f(x_left)   # 计算左逼近时的函数值
y_right = f(x_right) # 计算右逼近时的函数值

print("左极限逼近（x → 1⁻）：")
for xi, yi in zip(x_left, y_left):
    print(f"  f({xi}) = {yi:.6f}")  # 每次迭代更接近 2

print("\n右极限逼近（x → 1⁺）：")
for xi, yi in zip(x_right, y_right):
    print(f"  f({xi}) = {yi:.6f}")  # 每次迭代也更接近 2

print(f"\n结论：lim_{{x→1}} f(x) = 2（左右极限一致）")

极限与连续性基础（动画演示）

极限的ε-δ定义极限的严格定义是：对于任意给定的正数 ε（无论多小），总存在正数 δ，使得当 0 < |x - a| < δ 时，恒有 |f(x) - L| < ε。

左右极限与极限存在性函数 f(x) 在点 a 处极限存在的充要条件是：左极限 limₓ→ₐ⁻ f(x) 和右极限 limₓ→ₐ⁺ f(x) 都存在且相等。

什么用（应用，可选）：在AI中，极限思想用于分析模型训练的收敛性——当训练步数趋向无穷时，损失函数是否趋向于某个最小值。此外，数值优化中无穷级数的求和、积分的数值计算，都离不开极限的基本概念。理解极限还能帮助你阅读学术论文中的收敛证明。 哪些坑（缺点，可选）：最大的误区是认为极限就是函数在目标点的值——实际上极限根本不关心 f(a) 是多少，f(a) 甚至可以不存在。另外，极限如果存在必须唯一，不存在"两个极限"的情况。初学者还容易混淆"无穷大极限"（发散）和"极限不存在"这两种不同情况。

二、极限的计算方法

是什么（定义，可选）：极限计算是求函数在趋近过程中目标值的各种方法，包括直接代入法、因式分解法、有理化法、夹逼定理、洛必达法则等。

大白话 算极限就像是侦探破案——你不能直接看到终点的情况（因为函数可能在那个点没定义），但你可以收集靠近终点时的所有"线索"（函数值序列），通过这些线索推断终点处会是什么。

为什么（原理，可选）：极限计算是微积分的基本功。在导数定义中，差商的极限就是导数；在积分定义中，黎曼和的极限就是定积分。掌握极限计算方法，意味着你掌握了从"近似"到"精确"的桥梁——这是整个微积分方法论的核心精神。 怎么做（实现，可选）：

import numpy as np

# 方法1：直接代入法
# 对于连续函数，极限值就是函数值
def limit_direct_substitution(f, a):
    """直接代入：适用于连续函数"""
    return f(a)

# 方法2：因式分解法
# 处理 0/0 型不定式
def limit_factor_and_cancel(x_vals):
    """演示因式分解消去零因子的过程"""
    # 考虑 f(x) = (x^2 - 4)/(x - 2)，x → 2
    # 因式分解：x^2 - 4 = (x-2)(x+2)，消去 (x-2)
    # 得 x + 2，代入 x = 2 → 4
    results = []
    for x in x_vals:
        if np.abs(x - 2) > 1e-10:  # 避免除零
            raw = (x**2 - 4) / (x - 2)  # 原始表达式
        else:
            raw = None
        simplified = x + 2  # 消去零因子后的化简式
        results.append((x, raw, simplified))
    return results

# 方法3：夹逼定理验证
# 若 g(x) ≤ f(x) ≤ h(x) 且 g 和 h 的极限都是 L，则 f 的极限也是 L
def squeeze_theorem_demo():
    """使用夹逼定理验证 lim_{x→0} x*sin(1/x) = 0"""
    x_vals = np.array([0.1, 0.01, 0.001, 0.0001, 0.00001])
    g = -np.abs(x_vals)        # 下界函数：-|x|
    f = x_vals * np.sin(1/x_vals)  # 目标函数
    h = np.abs(x_vals)         # 上界函数：|x|
    
    print("夹逼定理演示：lim_{x→0} x·sin(1/x) = 0")
    print("  x\t\t下界-g(x)\t目标-f(x)\t上界-h(x)")
    for i in range(len(x_vals)):
        print(f"  {x_vals[i]:.5f}\t{g[i]:.6f}\t{f[i]:.6f}\t{h[i]:.6f}")
    print("结论：上下界均趋近于 0，因此目标函数极限也是 0")

# 方法4：数值逼近验证极限
def numerical_limit_verify():
    """数值方法验证 lim_{x→0} sin(x)/x = 1"""
    x_vals = np.array([0.1, 0.01, 0.001, 0.0001, 0.00001, 0.000001])
    ratios = np.sin(x_vals) / x_vals  # sin(x)/x 的数值序列
    print("\n数值验证：lim_{x→0} sin(x)/x = 1")
    for xi, ri in zip(x_vals, ratios):
        print(f"  x = {xi:.6f}, sin(x)/x = {ri:.10f}")

# 运行所有演示
print("=== 极限计算方法演示 ===\n")
squeeze_theorem_demo()
numerical_limit_verify()

# 因式分解法演示
print("\n因式分解法：lim_{x→2} (x²-4)/(x-2)")
print("原始函数在 x=2 处为 0/0 不定式")
print("因式分解：x²-4 = (x-2)(x+2) → 消去 (x-2) → 化简为 x+2")
print(f"代入 x=2：2+2 = 4 → 极限 = 4")

极限与连续性基础（动画演示）

洛必达法则若 f(x) 和 g(x) 在 a 点附近可导，且 limₓ→ₐ f(x) = limₓ→ₐ g(x) = 0（或同时趋于无穷），则在导数比值极限存在的前提下，有 limₓ→ₐ f(x)/g(x) = limₓ→ₐ f'(x)/g'(x)。

什么用（应用，可选）：夹逼定理的思想在AI中用于证明优化算法的收敛界——通过构造上下界来证明算法误差趋近于零。洛必达法则则帮助分析不定型的梯度行为，尤其在激活函数的饱和区分析中非常关键。因式分解的思想对应神经网络中"消除冗余项"的简化策略。 哪些坑（缺点，可选）：洛必达法则不是万能的——如果导数比值极限不存在，就不能使用。很多初学者在所有极限问题中都强行套洛必达，导致计算复杂化。夹逼定理需要巧妙地构造上下界，这需要经验和技巧。直接代入法只适用于连续函数，判断函数是否连续是代入前必须确认的条件。

三、连续性——没有"断裂"的函数

是什么（定义，可选）：函数 f(x) 在点 a 处连续，当且仅当同时满足三个条件：① f(a) 有定义；② limₓ→ₐ f(x) 存在；③ limₓ→ₐ f(x) = f(a)。如果函数在某个区间上每一点都连续，称它在该区间上连续。

大白话 想象你在纸上画一条线，笔尖没有离开过纸面——这就是连续性。连续函数的图像没有"跳跃"、没有"洞"、没有"悬崖"。你能一笔画到底，中间不需要抬笔。

为什么（原理，可选）：连续性是整个微积分的大前提。介值定理（连续函数能取到区间上任意中间值）和极值定理（闭区间上连续函数必有最大最小值）是优化理论的基石。在AI中，损失函数、激活函数的连续性确保了我们能用梯度下降找到最优解——如果函数不连续，梯度根本无从谈起。 怎么做（实现，可选）：

import numpy as np

def check_continuity(f, a, epsilon=0.0001):
    """数值检验函数在点 a 处的连续性"""
    # 条件1：f(a) 有定义
    try:
        fa = f(a)
        defined = True
    except (ValueError, ZeroDivisionError):
        defined = False
        fa = None
    
    # 条件2和3：左右极限存在且等于 f(a)
    h = np.array([0.1, 0.01, 0.001, 0.0001, 0.00001])
    left_vals = f(a - h)   # 左逼近函数值序列
    right_vals = f(a + h)  # 右逼近函数值序列
    
    # 判断左右极限是否一致
    left_limit = left_vals[-1]   # 取最小步长的逼近值作为近似极限
    right_limit = right_vals[-1]
    limit_exists = np.allclose(left_limit, right_limit, atol=epsilon)
    
    # 综合判断连续性
    if defined and limit_exists and np.allclose(fa, left_limit, atol=epsilon):
        return True, "连续 ✓"
    elif not defined:
        return False, "不连续：f(a) 无定义 ✗"
    elif not limit_exists:
        return False, f"不连续：左右极限不相等 ✗ (左≈{left_limit:.4f}, 右≈{right_limit:.4f})"
    else:
        return False, f"不连续：极限不等于函数值 ✗ (极限≈{left_limit:.4f}, f(a)={fa:.4f})"

# 测试不同的函数
print("=== 连续性检测实验 ===\n")

# 案例1：连续函数 f(x) = x² + 2x + 1（多项式处处连续）
f1 = lambda x: x**2 + 2*x + 1
print(f"案例1：f(x) = x² + 2x + 1, 在 x=2 处")
print(f"  结果：{check_continuity(f1, 2)[1]}")

# 案例2：可去间断点 f(x) = (x²-1)/(x-1), 在 x=1 处
# 该函数在 x=1 处无定义，但极限存在(=2)，为可去间断点
f2 = lambda x: np.where(np.abs(x-1) > 1e-10, (x**2 - 1)/(x - 1), np.nan)
print(f"\n案例2：f(x) = (x²-1)/(x-1), 在 x=1 处")
print(f"  结果：{check_continuity(f2, 1)[1]}")
print(f"  类型：可去间断点（极限存在但 f(1) 无定义）")

# 案例3：跳跃间断点——阶跃函数在 x=0 处
f3 = lambda x: np.where(x >= 0, 1.0, 0.0)
print(f"\n案例3：阶跃函数, 在 x=0 处")
print(f"  结果：{check_continuity(f3, 0)[1]}")
print(f"  类型：跳跃间断点（左右极限不相等）")

# 案例4：连续但不可导——绝对值函数在 x=0 处
f4 = lambda x: np.abs(x)
print(f"\n案例4：f(x) = |x|, 在 x=0 处")
print(f"  结果：{check_continuity(f4, 0)[1]}")
print(f"  注意：连续但不一定可导！连续性是可导性的必要条件")

极限与连续性基础（动画演示）

介值定理与极值定理介值定理：若 f 在 [a, b] 上连续，k 介于 f(a) 和 f(b) 之间，则存在 c ∈ [a, b] 使 f(c) = k。极值定理：闭区间上的连续函数必定达到最大值和最小值。

什么用（应用，可选）：在AI中，激活函数的连续性设计至关重要——ReLU虽不可导但连续，Sigmoid处处连续可导。连续性是反向传播能够成功进行的前提，因为链式法则要求每一层的传递函数局部可导（连续是可导的前提）。数值优化中，连续函数的极值定理保证收敛性分析有意义。 哪些坑（缺点，可选）：连续性不等于可导性！绝对值函数 |x| 在 x=0 处连续但不可导。Weierstrass函数甚至处处连续但处处不可导。在工程中，连续性主要靠"观察"判断，而可导性需要额外验证。另外，很多PPT级别的函数图看起来连续，但放大了某个局部可能会有极细的断裂。

四、极限在AI中的应用——梯度、收敛

是什么（定义，可选）：在AI语境下，极限思想主要体现在三个方面：①梯度的定义本身就是一个极限（差商的极限）；②优化算法的收敛性分析（参数序列的极限）；③神经网络在无限宽或无限深条件下的理论性质（函数空间的极限）。

大白话 如果把AI模型的训练比作登山者寻找山谷最低点，那么极限就是在回答两个问题：登山者每一步的方向对不对（导数=差商的极限），以及他最终能否到达山谷（参数序列的极限=收敛）。

为什么（原理，可选）：极限是连接离散和连续的桥梁。AI中的大部分计算实际上都是离散的（迭代步、采样点、有限差分），但分析这些离散过程的性质需要连续数学中的极限工具。例如，随机梯度下降（SGD）的收敛证明需要用到数列极限的理论；而理解为什么学习率不能太大，可以用泰勒展开的极限分析来解释。 怎么做（实现，可选）：

import numpy as np

def demonstrate_gradient_as_limit():
    """演示导数（梯度的一维版）是由于差商极限"""
    # 考虑 f(x) = x^3，在 x=2 处的导数
    x0 = 2.0
    h_values = np.array([0.5, 0.1, 0.05, 0.01, 0.001, 0.0001])  # 越来越小的步长
    true_derivative = 3 * x0**2  # f'(x) = 3x²，在 x=2 处 = 12（真实导数）
    
    print("=== 导数作为差商的极限 ===\n")
    print(f"f(x) = x³, 在 x={x0} 处, 真实导数 f'({x0}) = {true_derivative}")
    print("\n  h\t\t前向差商\t中心差商\t前向误差\t中心误差")
    for h in h_values:
        forward_diff = ((x0 + h)**3 - x0**3) / h       # 前向差商（一阶精度）
        central_diff = ((x0 + h)**3 - (x0 - h)**3) / (2*h)  # 中心差商（二阶精度）
        print(f"  {h:.6f}\t{forward_diff:.6f}\t{central_diff:.6f}\t"
              f"{abs(forward_diff - true_derivative):.6f}\t{abs(central_diff - true_derivative):.6f}")
    
    print("\n结论：当 h → 0 时，差商的极限 = 导数。中心差商收敛更快（二阶精度）")

def demonstrate_sequence_convergence():
    """演示梯度下降参数序列的收敛性"""
    # 最小化 f(x) = (x-3)^2，最小值在 x=3
    def f(x): return (x - 3)**2  # 二次函数
    def grad(x): return 2 * (x - 3)  # 梯度 f'(x) = 2(x-3)
    
    lr = 0.1  # 学习率
    x_current = 10.0  # 初始点
    history = [x_current]
    
    print("\n=== 梯度下降序列的收敛性 ===\n")
    print(f"目标：最小化 f(x) = (x-3)²，最优解 x* = 3")
    print(f"初始点 x₀ = {x_current}, 学习率 η = {lr}")
    print("\n  迭代\txₖ\t\t|xₖ - x*|")
    
    for k in range(20):
        x_current = x_current - lr * grad(x_current)  # 梯度下降步骤
        history.append(x_current)
        print(f"  {k:3d}\t{x_current:.8f}\t{abs(x_current - 3):.8f}")
    
    print(f"\n最终 x₂₀ = {x_current:.10f}")
    print(f"误差 = {abs(x_current - 3):.2e}")
    print("结论：参数序列 {xₖ} 的极限是 x* = 3，即算法收敛")

# 执行演示
demonstrate_gradient_as_limit()
demonstrate_sequence_convergence()

极限与连续性基础（动画演示）

什么用（应用，可选）：理解极限可以帮助你判断训练是否收敛（loss曲线趋于平坦）、分析梯度爆炸/消失问题（梯度的极限行为）、以及理解Batch Normalization为何有效（它保证了各层输入的极限分布稳定）。极限理论也是理解Adam、RMSprop等自适应优化器收敛性证明的关键。在强化学习中，价值迭代和策略迭代的收敛性也建立在极限理论基础之上。 哪些坑（缺点，可选）：收敛到局部最优而非全局最优是AI训练的常见困境——梯度下降只能保证数列收敛到某个稳定点，但未必是全局最小值。另外，SGD由于随机性，参数序列不以确定性的极限收敛，而是以概率收敛，这需要更复杂的数学工具来分析。还有，"训练loss趋于0"并不保证泛化性能好，这是收敛性和过拟合之间的经典权衡。

概念关系图谱

概念	核心含义	与AI的关系	关联概念
极限	函数值趋近的目标值	梯度计算的数学基础	连续性、导数、收敛
ε-δ定义	极限的严格数学化	为收敛性证明提供逻辑工具	分析学基础
左/右极限	单侧趋近的行为	ReLU等激活函数的边界分析	间断点分类
连续性	函数图像无缝衔接	损失函数可优化的前提	介值定理、极值定理
夹逼定理	用上下界夹出极限	优化算法的收敛界证明	不等式估计
洛必达法则	0/0和∞/∞不定式求极限	梯度消失/爆炸的渐近分析	导数、不定式
介值定理	连续函数取遍中间值	二分搜索的数学基础	连续性、根的存在性
极值定理	闭区间连续必有最大最小	优化问题解存在性的保证	最优化理论
差商极限	导数定义的原始形式	数值梯度的理论基础	导数、差分近似
序列收敛	数列趋向稳定值	训练过程的收敛判断	迭代算法、优化

重点答疑

Q1: ε-δ定义中的ε和δ到底是什么意思？

把 ε 想象成你能容忍的最大误差。比如你想验证极限是5，你可以说"我不允许误差超过0.001"，这就是 ε=0.001。δ则是你需要把x限制在多靠近a的范围内。ε-δ定义的威力在于：你随便设一个ε（不管多小），我都能找到一个δ来保证函数值不越界。如果无论ε多小我都能做到，极限就确实等于L。这就像一场数学博弈——挑战者设ε越小，应战者就必须找越小的δ。

Q2: 连续和可导有什么区别？为什么|X|在0点连续但不可导？

连续是"一笔画成"，可导是"画得光滑"——没有尖角。|x|在x=0处是连续的，因为从左和从右逼近时函数值都趋向0，且f(0)=0。但它的图像在x=0处有一个V形尖角——左导数=-1，右导数=+1，两者不等，所以不可导。在AI中，ReLU激活函数同样在x=0处连续但不可导（通常用次梯度替代）。

Q3: 无穷大是极限吗？lim 1/x (x→0) 等于多少？

当x→0⁺时，1/x趋向正无穷大，这不是传统意义上的极限存在（因为极限必须是一个有限数），但数学上称之为"发散到无穷大"，记作 limₓ→₀⁺ 1/x = +∞。需要注意的是左右极限不同（左侧趋向-∞），所以limₓ→₀ 1/x根本不存在——就连"发散到无穷"这种说法都不适用，因为左右符号相反。

Q4: 为什么说极限是微积分的基石？

因为微积分中的两个核心概念——导数和定积分——本质上都是极限。导数是差商（Δy/Δx）当Δx→0时的极限；定积分是黎曼和（无数小矩形面积之和）当分割无限细化时的极限。如果不理解极限，就只能把微积分当成一套机械的公式集合，而无法真正理解"瞬时变化率"和"无限累加"的深层含义。

Q5: 数值极限和符号极限有什么区别？

数值极限是用数值逼近的方法估算极限值（如本文的Python代码演示），它只能得到近似值，精度受浮点数限制。符号极限是通过代数运算（因式分解、洛必达等）精确求出极限。在AI中，训练时我们依赖数值极限（梯度下降每一步都是数值计算），但在理论分析中我们使用符号极限来证明收敛性。

章节单词汇总

英文	音标	术语/释义
limit	/ˈlɪmɪt/	极限
continuity	/ˌkɒntɪˈnjuːəti/	连续性
epsilon-delta	/ˈɛpsɪlɒn ˈdɛltə/	ε-δ 定义
left-hand limit	/left hænd ˈlɪmɪt/	左极限
right-hand limit	/raɪt hænd ˈlɪmɪt/	右极限
squeeze theorem	/skwiːz ˈθɪərəm/	夹逼定理
L'Hôpital's rule	/ˌloʊpiːˈtɑːlz ruːl/	洛必达法则
intermediate value theorem	/ˌɪntərˈmiːdiət ˈvæljuː ˈθɪərəm/	介值定理
extreme value theorem	/ɪkˈstriːm ˈvæljuː ˈθɪərəm/	极值定理
convergence	/kənˈvɜːrdʒəns/	收敛
divergence	/daɪˈvɜːrdʒəns/	发散
indeterminate form	/ˌɪndɪˈtɜːrmɪnət fɔːrm/	不定式
removable discontinuity	/rɪˈmuːvəbl ˌdɪsˌkɒntɪˈnjuːəti/	可去间断点
jump discontinuity	/dʒʌmp ˌdɪsˌkɒntɪˈnjuːəti/	跳跃间断点
asymptote	/ˈæsɪmptoʊt/	渐近线
neighborhood	/ˈneɪbərhʊd/	邻域
sequence	/ˈsiːkwəns/	数列/序列
difference quotient	/ˈdɪfərəns ˈkwoʊʃənt/	差商
numerical approximation	/nuːˈmerɪkl əˌprɒksɪˈmeɪʃən/	数值逼近

面试练习

Q1 [单选] 函数 f(x) = (x² - 9)/(x - 3) 在 x→3 时的极限是？

A. 不存在
B. 0
C. 6
D. 无穷大

解答：因式分解 x²-9 = (x-3)(x+3)，消去 (x-3) 后化简为 x+3，代入 x=3 得 6。注意 f(3) 本身无定义，但极限存在。

Q2 [单选] 函数 f(x) = |x|/x 在 x→0 时的极限是？

A. 1
B. -1
C. 0
D. 不存在

解答：左极限 limₓ→₀⁻ |x|/x = limₓ→₀⁻ -x/x = -1，右极限 limₓ→₀⁺ |x|/x = limₓ→₀⁺ x/x = 1。左右极限不等，故极限不存在。

Q3 [多选] 以下哪些函数在 x=0 处连续？

A. f(x) = sin(x)
B. f(x) = 1/x
C. f(x) = |x|
D. f(x) = x²

解答：sin(x)、|x| 和 x² 在 x=0 处均有定义且左右极限等于函数值，因此连续。1/x 在 x=0 处无定义（分母为零），不连续。

Q4 [单选] 洛必达法则可以用于 limₓ→₀ x·sin(1/x) 吗？

A. 可以，直接分子分母分别求导
B. 可以，但需要变形
C. 取决于x的正负
D. 不可以，这不是 0/0 或 ∞/∞ 型

解答：limₓ→₀ x·sin(1/x) 是 0 × 有界量的形式，极限为 0（夹逼定理可直接得出）。洛必达法则要求是 0/0 或 ∞/∞ 型的分式极限。

Q5 [多选] 连续函数具有哪些性质？

A. 闭区间上必能取到最大值和最小值（极值定理）
B. 闭区间上必能取到端点值之间的任意中间值（介值定理）
C. 一定处处可导
D. 若区间端点函数值异号，则区间内必有零点

解答：C错误——Weierstrass函数处处连续但处处不可导，是经典反例。A、B、D均是连续函数的基本定理。

Q6 [单选] 设 f 连续且 f(0)=2, f(3)=-1，则方程 f(x)=0 在区间 (0,3) 内：

A. 至少有一个根
B. 恰好有一个根
C. 没有根
D. 无法确定

解答：f(0)=2>0, f(3)=-1<0，由介值定理，中间必存在一点使得 f(x)=0。但不能确定根的数量（可能不止一个）。

Q7 [单选] limₓ→₀ sin(5x)/x 的值是？

A. 0
B. 1
C. 5
D. 不存在

解答：sin(5x)/x = 5 × sin(5x)/(5x)，令 t=5x，当 x→0 时 t→0，limₜ→₀ sin(t)/t = 1，故原极限 = 5×1 = 5。

Q8 [多选] 关于可去间断点，以下说法正确的是？

A. 函数在该点的极限存在
B. 可以通过重新定义该点的函数值使之连续
C. 左右极限不相等
D. 函数图像在该点有垂直渐近线

解答：可去间断点的特征就是极限存在但与 f(a) 不等（或 f(a) 无定义）。通过重新定义 f(a)=极限值，可以"修复"连续性。C是跳跃间断点的特征，D是无穷间断点的特征。

Q9 [单选] 梯度下降中参数序列 {xₖ} 收敛意味着什么？

A. 损失函数降到0
B. 参数值趋于某个稳定值
C. 学习率趋于0
D. 梯度恒为0

解答：收敛指 limₖ→∞ xₖ = x* 存在有限极限，即参数值稳定下来。这并不意味着损失降到0或梯度恒为0（可能在鞍点附近震荡）。

Q10 [多选] 以下哪些情形会导致极限不存在？

A. 左右极限不相等
B. 函数在趋向过程中无限震荡且不衰减
C. 函数值趋向于无穷大（发散）
D. 函数在目标点处无定义

解答：D错误——极限不考虑函数在目标点处的值，无定义不影响极限存在性（只要左右极限相同）。A、B、C都会导致极限不存在。B的典型例子是 limₓ→₀ sin(1/x)，它在 x→0 时无限次震荡。