C语言进阶知识--内存函数

本文聚焦C语言四大内存函数，详解其使用与部分模拟实现。memcpy从source复制num字节到destination，不遇'\0'停止，重叠内存结果未定义，附int数组复制示例及模拟实现；memmove可处理重叠内存，依场景正向/反向复制，示例中数组复制输出明确，含模拟实现；memset按字节设置内存，示例将字符串前6字节改为'x'；memcmp比较两指针后num字节，返回值反映大小关系，附字符

红豆子

718人浏览 · 2025-10-12 18:00:06

红豆子 · 2025-10-12 18:00:06 发布

C语言内存函数完全指南：从原理到实战的全方位解析

在C语言开发中，内存是程序运行的核心载体，但C语言不提供自动内存管理机制，所有内存操作需手动实现。而内存函数（memcpy/memmove/memset/memcmp）是C标准库中操作内存的“基石工具”——它们直接作用于内存地址，支持任意类型数据的复制、设置与比较，是数组操作、结构体处理、网络编程、文件IO等场景的核心依赖。

本文将从“函数特性→多场景实战→模拟实现→误区规避”四个维度，全方位解析这四大内存函数，帮你彻底掌握内存操作的底层逻辑。

一、memcpy：基础内存复制函数

memcpy是最基础的内存复制工具，核心作用是按字节粒度将源内存数据复制到目标内存，适用于无内存重叠的场景。

1.1 函数原型与核心特性

void * memcpy(void *destination, const void *source, size_t num);

参数说明：
- destination：目标内存起始地址（需可写，不可为NULL）；
- source：源内存起始地址（只读，用const保护，不可为NULL）；
- num：复制的字节数（而非元素个数，需根据数据类型计算）；
返回值：返回destination的原始地址（便于链式调用，如memcpy(dst1, memcpy(dst2, src, 10), 5)）；
三大核心特性：
1. 不依赖终止符：与字符串复制函数strcpy不同，memcpy不会因遇到'\0'停止，可复制二进制数据（如图片、音频）或含空字符的字符串；
2. 通用类型兼容：参数用void*（无类型指针）接收，可适配int/float/结构体等任意类型，但需强制转为char*后操作（因void*无法解引用，char*确保1字节粒度复制）；
3. 重叠内存未定义：若源内存（source）与目标内存（destination）地址范围重叠，复制结果不可预测（可能覆盖未复制的源数据），需改用memmove。

1.2 多场景实战案例

案例1：基础int数组复制

#include <stdio.h>
#include <string.h>
int main() {
    int arr1[] = {1,2,3,4,5,6,7,8,9,10};  // int占4字节，数组总大小40字节
    int arr2[10] = {0};                    // 目标数组初始化为0

    // 需求：复制arr1的前5个元素 → 5个int × 4字节/int = 20字节
    memcpy(arr2, arr1, 20);

    // 打印结果：前5个元素为1-5，后5个为0
    for (int i = 0; i < 10; i++) {
        printf("%d ", arr2[i]);  // 输出：1 2 3 4 5 0 0 0 0 0
    }
    return 0;
}

关键解析：若误将num设为5（元素个数），仅会复制5字节（1个完整int+1字节），导致arr2[1]值为0x02000000（小端存储），结果错误。

案例2：结构体数据复制（无指针成员）

#include <stdio.h>
#include <string.h>

// 定义无指针成员的结构体（可安全用memcpy复制）
struct Student {
    char name[20];  // 字符数组（非指针，内存连续）
    int age;        // 4字节整数
    float score;    // 4字节浮点数
};

int main() {
    struct Student s1 = {"Zhang San", 18, 95.5};
    struct Student s2;  // 未初始化

    // 复制整个结构体：sizeof(struct Student) = 20+4+4=28字节
    memcpy(&s2, &s1, sizeof(struct Student));

    // 验证结果：s2与s1数据完全一致
    printf("Name: %s, Age: %d, Score: %.1f\n", 
           s2.name, s2.age, s2.score);  // 输出：Name: Zhang San, Age: 18, Score: 95.5
    return 0;
}

注意：若结构体含指针成员（如char* name），memcpy仅复制指针地址（浅拷贝），而非指针指向的内容，可能导致内存泄漏或野指针。

1.3 模拟实现与细节解析

#include <assert.h>  // 用于断言空指针，调试时必加

void *memcpy(void *dst, const void *src, size_t count) {
    // 1. 保存目标内存原始地址（循环中dst会偏移，需返回初始地址）
    void *ret = dst;

    // 2. 断言：防止空指针访问（若dst/src为NULL，程序直接崩溃并提示错误）
    assert(dst != NULL && src != NULL);

    // 3. 逐字节复制：转为char*确保1字节粒度
    while (count--) {  // 先判断count>0，再自减，共循环count次
        *(char *)dst = *(char *)src;  // 解引用赋值（1字节）
        dst = (char *)dst + 1;        // 目标地址向后偏移1字节
        src = (char *)src + 1;        // 源地址向后偏移1字节
    }

    return ret;  // 返回原始目标地址
}

核心细节：

为什么用char*？因为char是C语言中唯一明确占1字节的类型，确保复制字节数与count完全一致；
为什么保存ret？若直接返回dst，循环后dst已指向复制区域末尾，调用者无法获取目标内存起始地址。

1.4 常见误区与规避建议

误区1：用memcpy复制重叠内存 → 改用memmove；
误区2：复制含指针成员的结构体 → 自定义深拷贝函数（手动复制指针指向的内容）；
误区3：忽略num的字节单位 → 始终用元素个数 × sizeof(元素类型)计算num。

二、memmove：支持重叠内存的复制函数

memmove是memcpy的“增强版”，核心差异是支持内存重叠场景，当源/目标内存重叠时，能保证复制结果正确。

2.1 函数原型与核心价值

void *memmove(void *destination, const void *source, size_t num);

与memcpy的唯一区别：memmove通过“动态选择复制方向”（正向/反向），解决了内存重叠问题；
核心价值：适用于“同一数组内数据迁移”场景（如将arr[0]复制到arr[2]），避免数据覆盖。

2.2 内存重叠场景分析

假设：

源内存起始地址为S，目标内存起始地址为D，复制字节数为N；
源内存范围：[S, S+N)，目标内存范围：[D, D+N)。

内存重叠分为两种场景：

场景1：无风险重叠（正向复制）

当D ≤ S（目标在源左侧）或D ≥ S+N（目标在源右侧，无交集）时，正向复制（从低地址到高地址）不会覆盖源数据。
例：S=0x100，D=0x080（左侧），N=20 → 复制时源数据未被覆盖。

场景2：高风险重叠（反向复制）

当S < D < S+N（目标在源中间，有交集）时，正向复制会覆盖未复制的源数据，需反向复制（从高地址到低地址）。
例：S=0x100（arr[0]），D=0x108（arr[2]），N=20（5个int）：

源范围：0x100~0x113，目标范围：0x108~0x11B；
重叠区域：0x108~0x113（源的后12字节与目标的前12字节重叠）；
正向复制：先复制0x100→0x108，会覆盖源0x108的数据，导致后续复制错误；
反向复制：先复制0x113→0x11B，再复制0x112→0x11A，避免覆盖源数据。

2.3 实战案例与结果解析

#include <stdio.h>
#include <string.h>

int main() {
    int arr1[] = {1,2,3,4,5,6,7,8,9,10};  // S = &arr1[0] = 0x...（假设）
    int i;

    // 需求：将arr1[0]开始的20字节（5个int）复制到arr1[2]（D = &arr1[2]）
    // 重叠判断：S < D < S+20 → 高风险重叠，需反向复制
    memmove(arr1+2, arr1, 20);

    // 打印结果：arr1[2]~arr1[6]为1~5，原arr1[3]~arr1[6]被覆盖
    for (i = 0; i < 10; i++) {
        printf("%d ", arr1[i]);  // 输出：1 2 1 2 3 4 5 8 9 10
    }
    return 0;
}

对比：若改用memcpy，结果可能为1 2 1 2 1 2 1 8 9 10（未定义），因正向复制覆盖了源数据。

2.4 模拟实现的分支逻辑

#include <assert.h>

void *memmove(void *dst, const void *src, size_t count) {
    // 保存原始目标地址
    void *ret = dst;
    assert(dst != NULL && src != NULL);

    // 分支1：无风险重叠 → 正向复制（与memcpy逻辑一致）
    if (dst <= src || (char *)dst >= ((char *)src + count)) {
        while (count--) {
            *(char *)dst = *(char *)src;
            dst = (char *)dst + 1;
            src = (char *)src + 1;
        }
    }
    // 分支2：高风险重叠 → 反向复制（从高地址到低地址）
    else {
        // 1. 定位到源/目标内存的最后1字节（count是总字节数，需-1）
        dst = (char *)dst + count - 1;
        src = (char *)src + count - 1;

        // 2. 逐字节反向复制
        while (count--) {
            *(char *)dst = *(char *)src;
            dst = (char *)dst - 1;  // 目标地址向前偏移1字节
            src = (char *)src - 1;  // 源地址向前偏移1字节
        }
    }

    return ret;
}

逻辑解释：
(char *)dst >= ((char *)src + count) → 目标起始地址在源结束地址之后（无交集），如S=0x100，D=0x120，N=20，正向复制安全。

2.5 注意事项

性能：memmove因多了分支判断，性能略低于memcpy，无重叠场景优先用memcpy；
兼容性：部分编译器（如GCC）已优化memcpy，使其支持重叠内存，但标准仍规定memcpy重叠结果未定义，跨平台开发需严格区分。

三、memset：字节级内存设置函数

memset是“内存初始化工具”，核心作用是按字节粒度将内存设置为指定值，常用于缓冲区清0或初始化字符数组。

3.1 函数原型与核心规则

void *memset(void *ptr, int value, size_t num);

参数说明：
- ptr：待设置的内存起始地址；
- value：要设置的值（int类型，但仅低8位有效，即value & 0xFF）；
- num：设置的字节数；
返回值：返回ptr的原始地址；
两大核心规则：
1. 字节级操作：memset仅能按字节设置，无法直接设置多字节类型（如int、float）的完整值；
2. value低8位有效：value是int类型（4字节），但实际仅用其低8位（因char占1字节），如value=0x1234，实际设置为0x34。

3.2 典型使用案例

案例1：字符数组初始化

#include <stdio.h>
#include <string.h>

int main() {
    char str[] = "hello world";  // 初始值：h e l l o   w o r l d \0（12字节）

    // 需求：将前6字节设置为'x'（ASCII值120）
    memset(str, 'x', 6);

    printf(str);  // 输出：xxxxxxworld（前6字节为'x'，后续保持不变）
    return 0;
}

案例2：缓冲区清0（网络编程常用）

#include <stdio.h>
#include <string.h>

#define BUF_SIZE 1024  // 缓冲区大小

int main() {
    // 未初始化的缓冲区，内存中是随机垃圾数据
    char recv_buf[BUF_SIZE];

    // 用memset清0：避免垃圾数据干扰后续数据处理
    memset(recv_buf, 0, sizeof(recv_buf));

    // 后续可安全使用缓冲区（如接收网络数据）
    return 0;
}

3.3 高频误区与反例

误区1：用`memset`给int数组设置非0值

#include <stdio.h>
#include <string.h>

int main() {
    int arr[3] = {0};
    // 错误需求：想将arr设置为{1,1,1}，实际按字节设置
    memset(arr, 1, sizeof(arr));  // sizeof(arr)=12字节，每个字节设为1

    // 打印结果：每个int为0x01010101（十进制16843009）
    for (int i = 0; i < 3; i++) {
        printf("%d ", arr[i]);  // 输出：16843009 16843009 16843009
    }
    return 0;
}

原因：int占4字节，memset(arr, 1, 12)会将每个字节设为0x01，组合后为0x01010101，而非1。

误区2：忽略`value`低8位有效

#include <stdio.h>
#include <string.h>

int main() {
    char buf[5];
    // 错误：想设置为0x12，实际用0x34（0x1234的低8位）
    memset(buf, 0x1234, 5);

    // 验证结果：每个字节为0x34（ASCII 52，字符'4'）
    for (int i = 0; i < 5; i++) {
        printf("%02X ", (unsigned char)buf[i]);  // 输出：34 34 34 34 34
    }
    return 0;
}

3.4 注意事项

适用场景：仅推荐用于char数组初始化或任意内存清0（value=0）；
效率：memset是标准库优化函数，清0效率远高于手动循环赋值，优先使用。

四、memcmp：任意内存比较函数

memcmp是“内存比较工具”，核心作用是按字节粒度比较两块内存的内容，支持任意类型数据（字符串、数组、结构体）的比较。

4.1 函数原型与比较逻辑

int memcmp(const void *ptr1, const void *ptr2, size_t num);

参数说明：
- ptr1/ptr2：待比较的两块内存起始地址；
- num：比较的字节数；

返回值规则（C标准规定）：

比较结果	返回值	说明
ptr1字节 > ptr2字节	>0	第一个不同字节的差值（或1，因编译器而异）
ptr1字节 < ptr2字节	<0	第一个不同字节的差值（或-1，因编译器而异）
前num字节完全相等	0	无差异

核心特性：
1. 无符号字节比较：C标准规定，memcmp将字节强制转为unsigned char后比较，避免负数比较错误；
2. 不依赖终止符：可比较二进制数据，无需担心'\0'；
3. 精确控制长度：通过num指定比较范围，避免越界。

4.2 多场景比较案例

案例1：字符串比较（区分大小写）

#include <stdio.h>
#include <string.h>

int main() {
    char buffer1[] = "DWgaOtP12df0";  // 字节序列：D(68) W(87) g(103) a(97) ...
    char buffer2[] = "DWGAOTP12DF0";  // 字节序列：D(68) W(87) G(71) A(65) ...
    int n;

    // 比较整个数组（含'\0'，sizeof(buffer1)=12字节）
    n = memcmp(buffer1, buffer2, sizeof(buffer1));

    if (n > 0)
        printf("'%s' > '%s'\n", buffer1, buffer2);
    else if (n < 0)
        printf("'%s' < '%s'\n", buffer1, buffer2);
    else
        printf("'%s' == '%s'\n", buffer1, buffer2);

    // 输出：'DWgaOtP12df0' > 'DWGAOTP12DF0'（g(103) > G(71)）
    return 0;
}

案例2：int数组比较（小端存储）

#include <stdio.h>
#include <string.h>

int main() {
    int arr1[] = {1, 2, 3};  // 字节序列：01 00 00 00 | 02 00 00 00 | 03 00 00 00
    int arr2[] = {1, 4, 5};  // 字节序列：01 00 00 00 | 04 00 00 00 | 05 00 00 00
    int ret;

    // 比较前2个int（8字节）
    ret = memcmp(arr1, arr2, 8);

    if (ret > 0)
        printf("arr1 > arr2\n");
    else if (ret < 0)
        printf("arr1 < arr2\n");  // 输出此结果（02 < 04）
    else
        printf("arr1 == arr2\n");
    return 0;
}

4.3 与`strcmp`的关键差异

对比维度	`memcmp`	`strcmp`
比较对象	任意内存（二进制/字符串/结构体）	仅字符串（以`'\0'`终止）
终止条件	比较完`num`字节或遇到不同字节	遇到`'\0'`或不同字节
长度控制	需显式指定`num`（字节数）	自动识别字符串长度（依赖`'\0'`）
适用场景	二进制数据比较、结构体比较	字符串比较（如字符串排序）
风险	`num`过大可能越界	无`'\0'`会导致越界访问

4.4 边界情况与编译器差异

边界情况：`num=0`

C标准规定，num=0时memcmp直接返回0（无实际比较），适用于动态长度判断：

#include <stdio.h>
#include <string.h>

int main() {
    char str1[] = "abc";
    char str2[] = "def";
    int ret = memcmp(str1, str2, 0);  // num=0，返回0
    printf("ret = %d\n", ret);  // 输出：ret = 0
    return 0;
}

编译器差异：返回值具体数值

GCC/G++：返回“第一个不同字节的无符号差值”，如0xFF vs 0x00，返回255；
Visual Studio：仅返回1（大于）、-1（小于）或0（相等），与差值大小无关。

开发建议：判断比较结果时，仅需关注ret>0/ret<0/ret==0，不要依赖具体数值。

4.5 注意事项

字节序影响：跨平台比较二进制数据（如网络传输的int）时，需先统一字节序（大端/小端），否则结果错误；
结构体比较：仅支持无指针成员的结构体，且需确保结构体无内存对齐差异（不同编译器对齐规则可能不同）。

五、总结：内存函数选型与实战建议

函数	核心功能	适用场景	关键禁忌
`memcpy`	基础内存复制	无重叠的内存复制（如数组、结构体）	不可复制重叠内存、含指针的结构体
`memmove`	重叠内存复制	同一数组内数据迁移（如`arr[0]`→`arr[2]`）	无重叠场景优先用`memcpy`（性能更高）
`memset`	字节级内存设置	字符数组初始化、缓冲区清0	不可给int/float数组设置非0值
`memcmp`	任意内存比较	二进制数据验证、结构体比较	不可比较含指针的结构体、跨平台需统一字节序

实战口诀：
复制看重叠（重叠用memmove，否则memcpy），
设值看字节（memset仅字节级，清0最常用），
比较看类型（字符串用strcmp，其他用memcmp）。

掌握这四大内存函数，就能灵活应对C语言中90%以上的内存操作场景，同时规避内存越界、数据覆盖、浅拷贝等常见问题。

北京朝阳AI社区

更多推荐

大模型相关知识

北京朝阳AI社区

全球 AI 大模型智慧竞争格局深度研究：为什么 GPT-5 被认为是唯一 “摸到智慧边缘“ 的模型

北京朝阳AI社区

C++与人工智能框架

重新排列范围，使得指定位置的元素等于排序后的元素，并且左边的元素都不大于它，右边的元素都不小于它。算法的原理是 “覆盖” 要删除的元素，将保留的元素移到前面，返回新的逻辑尾迭代器，但。对范围内的每个元素应用一个函数，并将结果存储在另一个范围内。移除范围内连续的重复元素，返回新的逻辑结尾迭代器。旋转范围内的元素，使中间元素成为新的第一个元素。这些算法不会改变它们所操作的容器中的元素。这些算法会修改它

北京朝阳AI社区

所有评论(0)

查看更多评论

红豆子

@HD12345432

已为社区贡献1条内容

C语言进阶知识--内存函数

红豆子

C语言内存函数完全指南：从原理到实战的全方位解析

一、memcpy：基础内存复制函数

1.1 函数原型与核心特性

1.2 多场景实战案例

案例1：基础int数组复制

案例2：结构体数据复制（无指针成员）

1.3 模拟实现与细节解析

1.4 常见误区与规避建议

二、memmove：支持重叠内存的复制函数

2.1 函数原型与核心价值

2.2 内存重叠场景分析

场景1：无风险重叠（正向复制）

场景2：高风险重叠（反向复制）

2.3 实战案例与结果解析

2.4 模拟实现的分支逻辑

2.5 注意事项

三、memset：字节级内存设置函数

3.1 函数原型与核心规则

3.2 典型使用案例

案例1：字符数组初始化

案例2：缓冲区清0（网络编程常用）

3.3 高频误区与反例

误区1：用memset给int数组设置非0值

误区2：忽略value低8位有效

3.4 注意事项

四、memcmp：任意内存比较函数

4.1 函数原型与比较逻辑

4.2 多场景比较案例

案例1：字符串比较（区分大小写）

案例2：int数组比较（小端存储）

4.3 与strcmp的关键差异

4.4 边界情况与编译器差异

边界情况：num=0

编译器差异：返回值具体数值

4.5 注意事项

五、总结：内存函数选型与实战建议

所有评论(0)

红豆子

误区1：用`memset`给int数组设置非0值

误区2：忽略`value`低8位有效

4.3 与`strcmp`的关键差异

边界情况：`num=0`