案例简述

最近在设计数据结构时,数据之间较为复杂,数据结构如下:

typedef struct tagDataInfo
{
    long offs;                // 索引
    char name[20];            // 姓名
    std::list<int> ord_list;  // 定单索引列表
    std::map<std::string, std::string> str_map; // 编号对应管理

    tagDataInfo() { memset(this, 0, sizeof(*this)); };
} DataInfo;

程序执行的时候,程序core dump了,经过查阅资料以及gdb调试,发现使用memset并没有像预期那样把所有元素都初始化。

知识梳理

结构很简单,就是为了体现数据之间的对应关系。
老生常谈的函数介绍:

函数原型
void *memset(void *s, int ch, size_t n);

函数功能

将s所指向的某一块内存中的前n个字节的内容全部设置为ch指定的ASCII值,
第一个值为指定的内存地址,块的大小由第三个参数指定,这个函数通常为新申请的内存做初始化工作,其返回值为指向s的指针,它是对较大的结构体或数组进行清零操作的一种最快方法。

引入头文件

<memory.h><string.h>

应用场景

memset函数通常用来对一块已经分配地址的内存进行初始化,并且通常初始化为0或者字符’\0’。如上述例子!

注意事项

(1)memset中的第三个参数一定要使用sizeof操作符,因为每个系统下对类型长度的定义可能不一样。
(2)memset中的第一个参数一定要是一个已知的、已经被分配内存的地址,否则会出错。
(3)大家可能比较疑惑,memset的第一个参数已经有了被初始化空间的首地址,为什么还要返回一个void*的指针去指向这个地址呢?这里之所以还要返回这个指针是为了实现链式编程,所谓链式编程,举个例子大家就明白了。
(4)最后一点,也是最重要的一点。一定要注意,memset是按照字节对待初始化空间进行初始化的,也就是说,函数里面的第二个参数的那个初值(一般为0)是按照一个一个字节往第一个参数所指区域赋值的,所以,对于单字节数据类型(char)可以初始化为任意支持的值,都没有问题,但是对于非多字节数据类型只能初始化为0,而不能初始化成别的初值,因为对所有字节按任意顺序赋值0的结果都是0,而如果初始化为其他的值,就会一个字节一个字节的进行赋值,从而出现奇怪的结果。比如说,上面的例3之所以没有出错就是因为初始化为0,但是如果初始化为1,那么因为int一般是4个字节,那么相当于将一个int元素初始化成了0000 0001 0000 0001 0000 0001 0000 0001,这样对于一个int元素肯定不是1,而是一个很大的数,结果出乎意料,所以一定要记住这一点,非常重要!!!

引申:何谓链式编程?
举例:

#include <iostream>
#include "string.h"
#include "stdlib.h"
#include "stdio.h"

int main()
{
        // 链式编程
        int i = 0;
        char cBuf [10];
        char cBuf1[10];

        // 这里是关键!!!
        memcpy(cBuf1, memset(cBuf, 'a', sizeof(char) * 10), sizeof(char) * 10);

        for (i = 0; i < 10; ++i)
        {
                printf("%c", cBuf[i]);
        }
        printf("\n");

        for (i = 0; i < 10; ++i)
        {
                printf("%c", cBuf1[i]);
        }
                printf("\n");

        return 0;
}

从上面这个例子中就可以看出,在memcpy这个函数中,直接使用了memset的返回值,用其来拷贝cBuf1这个字符数组,这样就可以直接连起来写,看起来十分方便。但是这个例子的应用形式却很少,只是为了说明这个问题才这样写的,这种结构在很多函数库里面比较常见,比如字符串操作函数等,但是链式编程也使得代码变得有些不直观,所以要有所取舍。

以上部分转载自http://blog.csdn.net/dan15188387481/article/details/49621447

问题剖析

1)上述也说了,memset是以字节为单位,初始化内存块
2)当结构体中包含指针时,在使用memset初始化要特别注意:

#include <iostream>
#include "string.h"
#include "stdlib.h"
#include "stdio.h"

int main()
{
        struct Parameters {
                int x;
                int* p_x;
        };
        Parameters par;
        par.p_x = new int[10];
        memset(&par, 0, sizeof(par));
        // 输出nil
        printf("地址: %p \n", par.p_x);

        int* ptr = new int[10];
        // 正确输出
        printf("地址: %p \n", ptr);
        return 0;
}

当memset初始化时,并不会初始化p_x指向的int数组单元的值,而会把已经分配过内存的p_x指针本身设置为0,造成内存泄漏。

同理,对std::vector等数据类型,显而易见也是不应该使用memset来初始化的。

正确Init

typedef struct tagDataInfo
{
    long offs;                // 索引
    char name[20];            // 姓名
    std::list<int> ord_list;  // 定单索引列表
    std::map<std::string, std::string> str_map; // 编号对应管理

    tagDataInfo() : offs(0)
    {
        memset(name, '0', sizeof(char) * 20);
        ord_list.clear();
        str_map.clear();
    };
} DataInfo;
Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐