php中文网

了解 C++ 数据类型、漏洞以及与 Java 的主要区别

php中文网

本文深入介绍了 c 中的各种数据类型,包括原始类型、派生类型和用户定义类型,同时还解决了缓冲区溢出和不正确的类型转换等常见漏洞。此外,它还强调了 c 和 java 之间的主要区别,重点介绍每种语言如何处理数据类型和内存管理,并提供安全编程的实用代码示例。

java 和 c 是两种面向对象编程 (oop) 语言,各有优缺点。本文探讨了两种语言之间的一些差异,重点是 c 数据类型和漏洞。 as well 上的代码示例以及有关如何防止常见问题的代码示例,例如 c 中的缓冲区溢出、整数溢出、不正确的类型转换和空指针取消引用。

c 数据类型

在 c 中,数据大致分为三种类型:原始(或内置)数据类型、派生数据类型和用户定义数据类型,见图 1:

图1
c/c 数据类型

注意:来自 argarwal 的“c 数据类型”(2023)

  • 原始类型也称为基本类型,是预定义的基本数据类型

在 c 中,请参阅下面的列表:

立即学习“Java免费学习笔记(深入)”;

整数(int):存储整数,通常需要4字节内存,范围从-2,147,483,648到2,147,483,647(argarwal, 2023)

表 1
c 整数

注意:来自 c 参考的“基本类型”(n.d.)

字符(char): 存储字符,要求,1 个字节,范围为 -128 到 127(对于 unsigned char 为 0 到 255)。请注意,从技术上讲,它们是正整数,使用其底层 ascii 代码将字符存储为整数。

宽字符 (wchar_t) 存储宽字符,通常需要 2 或 4 个字节,具体取决于平台。

布尔值(bool):存储逻辑值,true或false,通常需要1个字节。从技术上讲,它们是正整数,其中 o 为真,所有其他正整数为假。

浮点(float):存储单精度浮点数,通常需要4个字节。

double(双精度):存储双精度浮点数,需要8个字节

long double — 扩展精度浮点类型。不一定映射到 ieee-754 规定的类型。 (c 参考,n.d.,第 1 页)

void (void):具有空值集或不存在值的类型,通常用于不返回任何值的函数。

“输入一组空值。这是一个不完整的外部站点类型。无法完成(因此,不允许使用 void 类型的对象)。没有 void 数组,也没有对 void 的引用。但是,指针指向 void。并且允许返回 void 类型的函数(其他语言的过程)。” (c 参考,n.d.,第 1 页)

  • 派生数据类型是从原始数据类型派生而来的,它们包括:

数组:相同类型元素的集合。
指针:变量的内存地址。
功能: 执行特定任务的代码块。
引用:另一个变量的别名。
(阿加瓦尔,2023)

  • 用户定义的数据类型,顾名思义是由用户定义的
  1. 类: 将变量和函数存储到一个单元中。
  2. 结构(struct): 与类类似,但具有公共默认访问权限。
  3. 并集: 将不同的数据类型存储在同一内存位置。
  4. 枚举(enum):与整数常量相关的名称集,广泛用于视频游戏行业。
  5. typedef: 允许为现有数据类型创建或分配新名称。

模型之间的主要区别:c 与 java

在列出 c 和 java 数据类型之间的差异之前,我想先讨论一下这两种语言之间的主要差异和相似之处。

两种语言都是面向对象编程(oop)语言。然而,c 是平台相关的,而 java 是平台无关的,因为 java 的虚拟机 (jvm) 组件使用解释器将 java 编译为字节码,可以在任何具有 jvm 的系统上运行,这就是所谓的“ “一次编写,随处运行”功能(eck,2015)。此外,c 同时支持过程编程和面向对象编程,而 java 是严格的 opp,这使得 c 更适合操作系统编程。此外,java 是严格面向对象的,缺乏对全局变量或自由函数的支持(如 c 那样)。 java 将所有内容封装在类中。

c 和 java 之间的数据类型差异

下面列出了 c 和 java 之间的数据类型差异。

  • 两种语言都有原始数据类型;然而,c 同时支持有符号和无符号类型,这使得 c 原始数据类型更加灵活,但在无符号时安全性也较低。 java 原始数据类型默认是有符号的(eck,2015)。
  • java 原始数据类型具有固定大小并且与平台无关,而 c 原始数据类型存储大小与平台相关。
  • c 提供了原始类型和对象类型之间的一致性。 java 还区分基元和对象;但是,它具有用于基本类型的“包装类”,例如 integer for int,允许它们具有类似对象的行为(sruthy,2024)。
  • java 不支持结构体或联合数据类型,而 c 支持。
  • c 支持指针和引用类型,而 java 的支持非常有限。这是出于安全原因的选择。
  • c 变量具有全局作用域和命名空间作用域。另一方面,java 变量没有全局作用域;但是,它们可以具有包范围。
  • java 支持文档注释“javadocs”,而 c 不支持。

使用 c 数据类型时可能存在的漏洞

如果处理不当,c 数据类型可能会产生安全问题。因此,理解和识别 c 数据类型漏洞至关重要。下面列出了处理 c 数据类型时可能出现的最常见漏洞以及如何缓解这些漏洞。

1。缓冲区溢出

当写入内存的数据超过缓冲区分配的容量时,就会发生缓冲区溢出。这可能会导致程序崩溃或恶意代码执行。为了防止缓冲区溢出,重要的是在编码之前检查边界,并使用像“fgets”这样的库函数来抵抗缓冲区溢出。避免使用容易出现缓冲区溢出的“scanf”、“strcpy”、“printf”、“get”和“strcaf”(guardrails,2023)。

请参阅下面的代码示例。

#include <iostream>
#include <cstdio>

int main() {
    char buffer[10];
    std::cout << "enter a string: ";
    fgets(buffer, sizeof(buffer), stdin);  // avoids buffer overflow by 
                                           // limiting input
    std::cout << "you entered: " << buffer << std::endl;
    return 0;
}

2。整数上溢和下溢

当尝试存储在整数变量中的值超过整数可以容纳的最大值时,就会发生整数溢出(snyk 安全研究团队,2022 年)。当一个值小于整数可以容纳的最小值时,就会发生整数下溢。

为了防止整数上溢和下溢,请在执行算术运算之前始终验证值,请参阅下面的代码示例:

#include <iostream> 
#include <climits> // for int_max  int add(int a, int b) {
    if (a > 0 && b > int_max - a) {
        std::cerr << "integer overflow detected!" << std::endl;
        return -1;  
    }
    return a + b;
}

int main() {
    int x = int_max - 1;
    int y = 2;
    std::cout << "result: " << add(x, y) << std::endl;
    return 0;
}

注意,在将a和b相加之前,在add函数中,会检查将它们相加会导致溢出的条件,这里的和大于允许的整数最大值。

3。类型转换不正确

将有符号整数转换为无符号整数时,经常会发生不正确的类型转换,从而导致意外的数据丢失。这可以通过非隐式转换数据类型来避免,例如,避免将 double 转换为 float 或将有符号类型转换为无符号类型。

请参阅下面的代码示例:

#include <iostream>  

void checklength(int len) {
    if (len < 0) {
        std::cerr << "negative length detected!" << std::endl;
        return;
    }
    std::cout << "length is: " << len << std::endl;
}

int main() {
    // incorrect implicit conversion    
    unsigned int value = -5;  // unsigned int are always non-negative 
    checklength(static_cast(value));  // properly handle conversion
    return 0;
}

4。指针初始化

空指针是一个众所周知的漏洞,可能导致程序崩溃和潜在的恶意利用。在取消引用指针之前,请务必检查指针是否为“nullptr”。

请参阅下面的代码作为示例。

struct list {
    void *p;
    struct list *next;
};

int f(struct list *l) {
    int max = -1;
    while (l) {
        int i = *((int*)l->p); // Cast void* to int*
        max = i > max ? i : max;
        l = l->next;
    }
    return max;
}

请注意,“void”用于在链表中存储通用指针,并且在使用之前将其强制转换为“int”。

总而言之,通过了解 c 数据类型及其相关风险来了解 java 和 c 之间的差异,对于编写安全程序至关重要。这可以通过仔细管理数据类型、执行边界检查、验证类型转换和安全处理指针(例如通过检查空值和正确转换 void 指针)来完成。


参考文献:

亚当,j. 和凯尔,s.(2020)。类型检查超越类型检查器,通过切片和运行。第 11 届 acm sigplan 自动程序分析工具国际研讨会 (tapas 2020) 论文集。计算机协会,23-29。摘自:https://dl-acm-org.csuglobal.idm.oclc.org/doi/10.1145/3427764.3428324

argarwal, h.(2023 年,9 月 23 日)。 c 数据类型。 googsforgeeks。 https://www.geeksforgeeks.org/cpp-data-types/

c 参考(n.d.)。基本类型。 cppreference.com。 https://en.cppreference.com/w/cpp/language/types/

eck,d.j.(2015)。第一章概述:心理景观。使用 java 编程简介(第七版)。 cc by-nc-sa 3.0。 http://math.hws.edu/javanotes/

guardrails,(2023 年,4 月 27 日)。最重要的 c 安全漏洞以及如何缓解这些漏洞。安全大道。 https://securityboulevard.com/2023/04/the-top-c-security-vulnerabilities-and-how-to-mitigate-them/

snyk 安全研究团队(2022 年,8 月 16 日)。斯尼克。https://snyk.io/blog/top-5-c-security-risks/

sruthy,(2024 年,3 月 7 日)。 c 与 java:c 和 java 之间的 30 个最大差异(附示例)。软件测试帮助。 https://www.softwaretestinghelp.com/cpp-vs-java/


最初发表于 alex.omegapy on medium,由 level up coding 于 2024 年 10 月 12 日发布。

以上就是了解 C++ 数据类型、漏洞以及与 Java 的主要区别的详细内容,更多请关注php中文网其它相关文章!