读十堂极简人工智能课笔记04_计算机视觉

news/发布时间2024/4/20 22:41:23

1. 仙女蜂

1.1. Megaphragma mymaripenne

1.2. 一种微小的蜂类

1.3. 人类已知第三小的昆虫

1.4. 大脑仅由7400个神经元组成,比大型昆虫的大脑小了好几个数量级

1.5. 微小的身体里没有空间容纳这些神经元,所以在生长的最后阶段,它把每个神经元内最重要的细胞核剥离出来以节省空间

1.6. 我们还无法理解如此少的神经元如何能够实现如此复杂的感知和控制

1.7. 它的感知机制似乎比今天的人工智能简单得多

1.7.1. 我们的人工智能往往是借助大量的数据、成千上万的人工神经元和巨大的计算能力,用蛮力训练出来的

1.7.2. 小小的仙女蜂告诉我们,自然界其实还有很多更优雅、更简单的方法来感知世界

1.7.3. 其能力是任何机器人都无法比拟的

2. 感知

2.1. 感知是人工智能的一个重要方面

2.1.1. 传感器是极其重要的,但它只是感知的第一步

2.1.2. 面对连续不断流入其数字大脑的数据,人工智能也必须连续不断地分辨出意义

2.2. 如果没有感知外部世界的能力,我们的人工智能就只能活在数字宇宙中,用数据进行神秘晦涩的思考,却与现实毫无关联

2.2.1. 感官将它们与我们的世界联系起来

2.2.2. 摄像机给了它们视觉

2.2.3. 麦克风给了它们听觉

2.2.4. 压力传感器提供了触觉

2.2.5. 加速计提供了方向感

2.2.6. 各种奇奇怪怪的、通常用于科学和工程的传感器

2.2.7. 化学传感器能够比我们的鼻子或舌头更准确地检测化学物质

2.3. 无人驾驶车辆

2.3.1. 激光雷达(三维激光扫描)来检测周围的物体和它们的位置,而不用顾虑光线的强弱

2.3.2. 相机可以看到我们肉眼无法看到的光的频率,人工智能可以借此看到热辐射或无线电波

2.3.3. 嵌入车辆马达的传感器,以及通过手机信号塔和Wi-Fi信号进行运算的三角测量技术和GPS能帮助人工智能准确了解车子在地球上的位置,以及自己目前运动的速度

3. 学会看见

3.1. 计算机视觉的早期工作

3.1.1. 将图像分解为组成元素,类似于当时公认的人类眼睛的工作方式

3.1.2. 许多巧妙的算法来检测几何形状,然后将图像分割成清晰可辨的区域

3.1.3. 用于在立体摄像机的图像中估算物体间的距离

3.1.4. 用于跟踪移动的物体

3.1.5. 借助从不同角度拍摄的若干图像,构建场景的三维内部模型

3.2. 坎尼边缘检测法

3.2.1. 创造者约翰·坎尼

3.2.2. 计算机视觉中最流行也最常用的方法之一

3.2.3. 精准的检测

3.2.3.1. 应该发现真正的边缘,而尽量避免错报

3.2.4. 精准的定位

3.2.4.1. 应该正确地找出边缘的确切位置

3.2.5. 正确的边缘计数

3.2.5.1. 每条实际的边缘应该检测为一条边缘,而不是多条边缘

3.3. 使用统计方法,创造了一类算法,通过一组“平均脸部特征”(基图像,或称本征脸)来识别人脸

3.4. 机器人现在能有更强大的自信四处走动,是因为人工智能现在可以识别简单的形状并跟踪物体的运动

3.4.1. 在照明不足的情况下,或在传感器数据不够完善时,仍然表现不佳

3.5. 计算机视觉系统来发现制造过程中的错漏以进行质量控制,而回收厂则利用它对垃圾进行适当的分类

4. 神经网络

4.1. 人工神经网络是一种成熟且非常成功的人工智能类型

4.2. 其原理是把生物大脑的工作方式高度简化,得到一种模型,由此在计算机中运行

4.3. 神经网络通过改变神经元之间连接的权重来进行学习,它会根据不同的输入,让一些连接变得更重要,而让另一些连接变得不那么重要

4.4. 训练神经网络的最大问题之一是正确的数据

4.5. 前馈式

4.5.1. 每一层的神经元只与下一层相连,而不会反向连接

4.6. 反向传播

4.6.1. 计算机从输出神经元开始,通过各层神经元反向逐层更新权重和偏置,最终让输出的误差降到最小

4.6.2. 训练这种前馈式神经网络的常用方法

4.7. 卷积神经网络

4.7.1. 视网膜上的感光细胞(人眼的视杆或视锥)并不直接连接到单个神经元上,而是会有一整片区域的神经元与每一个感光细胞相连接

4.7.2. 与传统的前馈式神经网络的全连接层相比,这是一种截然不同的神经网络布线方式

4.7.3. 一种常用于计算机视觉的深度学习网络

4.7.4. 所谓“深度”,正是因为它有很多层神经元

4.7.5. 大数据时代使得给这些神经网络喂数据变得容易得很

4.7.5.1. 有数以百万计的几乎任何种类的图像例子

4.7.6. 2012年,计算机视觉已经超越了人类视觉,它们能以超人的精度识别图像中的物体

4.7.7. 卷积深度神经网络现在已经变得非常聪明,我们不再需要预先计算图像的特征

4.7.7.1. 神经网络自己就能完成这一切

4.8. 胶囊神经网络

4.8.1. 为卷积神经网络增加了更多的由生物体启发的层次结构,把神经网络改进得更加强大

5. 种族主义

5.1. 偏见在我们的社会中普遍存在,因此同样的偏见传播到人工智能领域也就不足为奇了

5.1.1. 技术反映了我们的内心以及我们的偏见

5.1.2. 不公的偏见可能会导致对某些群体的识别结果出现偏差

5.1.3. 在监督学习中,人工智能的表现只能是我们训练出来的表现

5.2. 人工智能通常主要用浅肤色男性的图像进行训练,而不是其他性别或肤色的人

5.3. 面部识别的人工智能可能在浅肤色男性图像上表现出色,但面对深肤色女性的图像时却容易出错

5.4. 来自业界领先的公司IBM、微软和亚马逊的人工智能系统都给奥普拉·温弗瑞、米歇尔·奥巴马和塞琳娜·威廉姆斯的脸做出了错误分类,而面对白人男性的脸则完全没有问题

6. 伪造

6.1. 训练偏差并不是计算机视觉的唯一问题

6.2. 深度伪造算法可以在视频中将一个人的脸无缝替换成另一个人的脸

6.2.1. 广泛用于色情业

6.2.2. 用于歪曲政治家

6.2.3. 进行诈骗

6.2.4. 区分事实与虚构从未如此困难

6.3. 恶意深度伪造禁止法

6.3.1. 在2018年

6.4. 深度伪造问责法

6.4.1. 在2019年

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.jwkm.cn/p/48745452.html

如若内容造成侵权/违法违规/事实不符,请联系宁远站长网进行投诉反馈email:xxxxxxxx@qq.com,一经查实,立即删除!

相关文章

2024.2.16

寄 算是比较难的树形dp了吧。。。 我的跟题解做法不太一样,是维护2个数组 \(dp_{0/1,i}\) 和 \(f_{0/1,i}\)。不太好说,看题解做法吧QAQ。原神 #include <bits/stdc++.h>typedef long long ll;const ll SIZE = 10000 + 100;ll N, M, a[SIZE]; ll C;ll cnt = 1, head[SI…

车辆智能制造能力概述

车辆智能制造能力概述 图2-73表示车辆制造能力示例。图2-73. 车辆制造能力示例 图2-74表示车辆智能车间示例。图2-74. 车辆智能车间示例 图2-75表示车辆智慧物流示例(一)。图2-75. 车辆智慧物流示例(一) 图2-76表示车辆智慧物流示例(二)。图2-76. 车辆智慧物流示例(二)…

Large Batch Experience Replay

发表时间:2021(ICML 2022) 文章要点:这篇文章把experience replay看做一个通过importance sampling来估计梯度的问题,从理论上推导经验回放的最优采样分布,然后提出LaBER (Large Batch Experience Replay)算法来近似这个采样分布。 非均匀采样mini batch可以看成一个基于re…

【译】为什么AI写作会显得枯燥无味

原作:本乌兰西 引子:绘画中减色混合的原理照片由 Unsplash 上的 Lucas K 拍摄当我还是个孩子的时候,我坐在一个有各种颜色的调色板前,努力尝试混合尽可能多的颜色。怀着兴奋的眼神,我看着鲜艳的颜色在画面上融合。随着越来越多的颜色相互融合,我困惑地盯着由此产生的聚合…

手把手教你如何下载小鹅通上已购买的视频课程

前言:很多同学都想知道小鹅通中视频课程怎么下载,但是小鹅通上面已购买的视频课程是不提供直接下载方式的,所以下面就教大家如何用学无止下载器下载小鹅通上面已购买的视频课程。 一、电脑网页打开小鹅通官网(https://study.xiaoe-tech.com),找到已购买的课程二、找到想要…

CRC算法原理和代码实现

前言 ​ 由于现在的工作涉及到协议的对接,而协议使用CRC进行校验。并且在MATLAB传C的过程中有可能需要使用到CRC来校验数据。所以在这篇文章中对CRC校验的有关知识进行梳理,也是自己对这方面知识点的梳理和总结吧。 什么是CRC校验 ​ CRC(Cyclic Redundancy Checksum循环冗余…