智能信息系统建模 – 涼宮ハルヒ

很喜欢一段话，来自选课社区，部分内容修改

课程内容：大概可以理解为一些软件工程plus+一些过时没用的东西。

上课自由度：chm不怎么管出勤，但多次表示有计入考勤的冲动；wd经典每节课上传jbox签到。

考核标准：
(1) chm部分占比75%，2次个人作业，1次小组作业，分别是根据给出的业务画一些UML活动图，根据给出的业务制作Petri网（课上要讲的新东西），基于RPA提取发票信息（这RPA真的难用，python全做完然后谎称用的RPA比较合适（不是），最后基本都是调用腾讯阿里API）。每次作业后会直接在课堂上汇报答辩，每个人会轮到一次。
(2) wd部分占比25%，1次读书读后感（没用的老古董），2次小组作业（都要做pre，一个是阅读一个讲数据库设计的书做ppt，一个是卷一些没用但很难写的文档）。
(3) 期末考试，wd相当于透题，两道问答题；chm要画一些UML，类图，Petri网，数据流分析。在后半学期任务量比较大。

授课质量：读ppt，都是些古老过时的知识，个人感觉没啥用。

查这门课评价的应该有很多对选方向有疑问的同学吧，我只说一下个人感受，非常主观，慎重参考，如有反对，你说得对：

想学到大数据、AI等相关知识的同学：快跑。这方向的三门课，一门是没什么用且陈旧的意义不明课，一门是过时且走马观花无实际意义的听名字很好但实际依托课，一门是只有些理论没有示例demo且任务量大的所谓方向收口课。实际体验下来，学到的东西很有限，只能算是得到了一些科普性的拓展。想学这些知识的不如找几本书、几篇博客、几个项目去看一看，课上听不到任何有价值有深度的内容。

觉得这个方向轻松想要混日子的同学：快跑。wd相关的作业任务量又大又没意义，chm相关的作业意义不明不过任务量一般，其他老师相关的作业则是造火箭。或许“轻松”来源于上课睡觉或者上课做自己的事情？

觉得这个方向对就业有帮助的同学：快跑。课上内容深度不足（看几篇博客就能学到的东西能帮你找到工作就怪了），项目经历零增长，不如自己找几个项目看看。想就业的同学可以找rr好好聊聊，比纠结方向有用多了。

推荐哪些同学来：
(1) 决定完全不考虑另外两个方向的同学。
(2) 非常想要和这方向有关的实验室搭上关系的同学。
(3) 想要一整年上课睡大觉或者做自己事情的同学。
(4) 喜欢吃史的同学。
其他同学，能劝一个是一个，有点犹豫的都别来，你的犹豫源于信息的极度缺乏，你的期待源于方向名称和课程名称的“欺诈”，几乎必然会在了解实情之后感到后悔。

总结：能劝一个是一个，快跑。

类图要点分析角度：

正确性
关系为什么这样是合理的（参考下面黄色内容）
范式化1-3-BC-4-5；反范式（你要是遍历比join还快你分什么表呢）
- 1范式：原子性 2泛式：依赖主键 3泛式：不存在传递依赖反泛式：不按前面来
属于什么CDM(E-R)
- 概念数据模型-由矩形实体、菱形联系和椭圆属性组成。这是实体关系模型 (Entity-Relationship model)。

LDM逻辑数据模型-实体包括属性
- 反映的是系统分析设计人员对数据存储的观点，是对概念模型的进一步分解和细化。

直接连的添加。一对一的添加，一对多的在多的加，多对多的添加新的关系。

/PDM物理数据模型-落在数据库上

有没有基于“行业数据模板的数据模型”进行设计
使用了主题数据库进行数据规划
使用了信息资源管理基础标准

流程建模

表格形式列出任务（动词+名词）、资源、对应关系；10分至少10个活动

基于活动

本质是时序，按照从早到晚。主要包括：业务任务划分，软件功能结构设计，面向执行的活动系列以及控制逻辑的描述。

带泳道的UML图

对象活动的顺序关系所遵循的规则

角色行为图RAD

评价：角色交互清晰明了，但会使得表变复杂，同时不支持模型分解（只适合总览）

状态图

基于数据

基础数据（主数据）：主要是相对稳定、可以在公共范围内重用的基础数据，可独立存储并单独存在，主要的操作可以分为只读不写，以及单独的增删权限等。
业务数据：是大量生产及重复处理的业务数据。
状态数据：面向流程类应用的信息控制所建立的数据，主要体现为主数据或者事务数据的动态状态变化。
元数据：数据管理相关的数据。
非结构化数据：模型、视频、语音等多模态数据，在大数据时代越来越多。

乘客、站点、司机和车辆被抽象为一些基本实体，而面向运行过程中的调度、计数、路线等抽象为业务实体或关联实体。

TFD（业务流程图）和 DFD（数据流图）都是描述业务数据处理过程的图形建模方法。
从描述的重点来看，TFD 强调业务过程中每一项处理活动和具体业务部门的关系。而 DFD 更注重描述业务内数据间的关系及业务的“系统”特征，标识业务通过外部实体与其环境交换信息。
从使用者的角度来看，用 TFD 描述企业各项业务的数据处理过程更容易与用户进行交流。DFD 较 TFD 抽象，描述的是业务处理过程的数据处理模式，但难于描述系统的控制流。

基于事件

EPC

基于状态

Petri

库所（Place）圆形节点，代表状态
转移（Transition）方形节点，代表活动动作/转换
连接（Connection）是库所和转移之间的有向边，具有方向，用有向弧表示。
托肯（Token）是库所中的动态对象，可以从一个库所移动到另一个库所，用实心小圆点表示。

规则

t1具有三个输入库所 (p1，p2 , p3) 和两个输出库所 (p3 , p4)；库所p3既是t1的输入库所又是它的输出库所

转移的使能条件：如果输入库所都包含了托肯，那么转移就被激活

一个库所链接多个转移，随便走一个；一个转移连多个库所，每个都走。多个库所链接转移，需要都符合条件才可以进行下去。

小练习

转移图

1代表p为t的输出库所，-1代表p为t的输入库所，0代表无联系

流程挖掘及优化

alpha算法

算法不考虑次数，因此对于噪声和不完全性非常敏感

模糊挖掘模糊挖掘（Fuzzy Mining）：设定不同的阈值实现多层次活动的生成及展示。
启发式挖掘（Heuristic Mining）：将不频繁的路径从模型生成中去掉，建立因果依赖使得模型更好地被表述。
基于区域的挖掘：可以进一步分为基于状态、基于语言等类别，是一种典型的区域挖掘方法。算法核心是发现流程的cursor。
遗传流程挖掘（Genetic process mining）：不确定的挖掘方式，通过迭代来模仿自然演变。通过初始化、选择、繁殖、结束等方式实现遗传算法和流程挖掘的结合及应用。

评价体系：

拟合度：对流程的覆盖性
简洁度：简洁度
泛化度：对不在数据范围内的行为的可扩展性
精确度：是否包括过多“不存在”的流程

四种模型：

顺序模型：只描述出现最多的系列，其他作为噪声过滤