[C++] 化学方程式的格式化算法

2018-12-09 11:18:14来源:博客园 阅读 ()

新老客户大回馈,云服务器低至5折

网上普遍使用的化学方程式的格式普遍如下

例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O

要把化学方程式格式化,单单一个正则表达式是非常反人类的,故可选用 C++ 实现化学方程式的格式化。

首先,写一个 for 循环,传入字符数组 input[] ,依次地判断当前字符的位置

然后,声明一个宽字符串: wstring output[]

算法根据循环里的 if 语句判断当前字符是否符合条件,然后把这个字符输出到 output[] 中

for(int i=1;i<strlen(input);++i)
{
// Do something...
};

因为传入的字符数组是没有经过格式化的,所以第一个字符一定不用处理,故循环从1开始。

循环开始时,先判断当前的字符是不是空格,如果是空格,就直接无视,跳到下一次的循环。

因为直接跳到了下一次的循环中,所以 input[i] 的字符没有加入到 output 中,也就是自动地把空格给除去了。

然后,在判断当前的字符是否为 +、=、(、) 中的一种,因为这个字符的前后是不可能存在数字下标的,直接加入到输出的 output[] 数组中。

同样的,遇到前一个字符是 +、=、( 也同样直接加入到输出数组中。

实现代码:

for (int i = 1;i < strlen(input);++i)
{
    if(input[i] == ' ') continue;
    if (input[i - 1] == '+' || input[i - 1] == '='
        || input[i - 1] == '(' || input[i] == '+'
        || input[i] == '=' || input[i] == '('
        || input[i] == ')') {
        output += input[i];
        continue;
}

继续我们的判断,如果当前字符是 A-Z 、 a-z 的,直接加入输出字符数组中。

如果当前字符是数字的,直接将它变成下标。

为了防止 C60 这种由超过 9 个原子组成的分子参与化学反应的情况,所以还要加入一句判断语句来判断。

实现代码:

for (int i = 1;i < strlen(input);++i)
{
    if(input[i] == ' ') continue;
    if (input[i - 1] == '+' || input[i - 1] == '='
        || input[i - 1] == '(' || input[i] == '+'
        || input[i] == '=' || input[i] == '('
        || input[i] == ')') {
        output += input[i];
        continue;
    }

    if (input[i] >= 'A' && input[i] <= 'Z') {
            output += input[i];
            continue;
    }

    if (input[i] >= 'a' && input[i] <= 'z') {
            output += input[i];
            continue;
    }

    if (input[i - 1] >= '0' && input[i - 1] <= '9') {
            output += input[i];
            continue;
    }

    if (input[i] >= '0' && input[i] <='9')
    {
            outputBigNumToSmall((int)(input[i]-'0'));
    }

}

因为 C++ 标准库并没有把数字转成下标的函数,所以我们要实现一个将数字转成下标的函数

实现代码:

void outputBigNumToSmall(int num)
{
    switch (num)
    {
    case 0:
        output.append(L"?");
        break;
    case 1:
        output.append(L"?");
        break;
    case 2:
        output.append(L"?");
        break;
    case 3:
        output.append(L"?");
        break;
    case 4:
        output.append(L"?");
        break;
    case 5:
        output.append(L"?");
        break;
    case 6:
        output.append(L"?");
        break;
    case 7:
        output.append(L"?");
        break;
    case 8:
        output.append(L"?");
        break;
    case 9:
        output.append(L"?");
        break;
    default:
        output.append(L"(unknown)");
        break;
}

至此,只要输出 output[] 就可以了。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:1086 Tree Traversals Again (25 分)(二叉树的遍历)

下一篇:gdb 基础