1. 大数据 知识图谱
徐小良,男,1978年6月30日出生,中国籍,无境外永久居留权,汉族,上海交通大学本科毕业。2002年5月至2003年5月于斗荣株式会社任研发工程师;2003年5月至2006年12月于Univelsal(上海)照明有限公司任研发主管;2007年1月至2015年1月于上海亚明照明有限公司任研发经理;2015年4月至2016年3月于江苏昊美光电科技有限公司上海分公司任技术总监;2016年4月起担任上海琪瑜光电科技股份有限公司副总经理。
徐小良的主要研究领域为大数据、知识图谱、自然语言处理等,曾主持开发浙江省科技厅、省社科联、省科协等科技项目管理政务系统,其研发团队更是吸收了来自阿里、华为等知名IT公司优质研发人员。他向记者介绍,以往技术需求方很难基于需求搜取到合适的科技成果,也并不知该向哪位业内专家请教,同时,技术供给方也不知道自己的科研成果能真正地用于何处。
为此,团队开始对全国高校科技人才及其科研成果进行数据采集,通过规整加工形成科技领域大数据知识图谱。经过长期的攻坚研发,高校科技服务大脑现已汇集全国近700万人才、2000万项专利、3000万篇学术论文、100万项科研项目及成果的数据,并逐步实现科技人才搜索、技术供需匹配、专家能力图谱分析、领域专题分析等功能。
2. 数据挖掘资料
它的理论核心就是挖掘计算方法,计算方法是对数据所具有的价值进行深度挖掘到的重要工具,这些计算的方法和统计的方法都是被全世界的统计学家公认的道理,通过对数据的统计和计算等可以深度的挖掘出数据所具有的价值,并且在经过精准的计算和挖掘之后才能够对数据进行高效而又大量的处理,从而能够让人们迅速的找到数据利用的价值。
3. 数据库知识图谱
知识图谱简单明了易懂。结构数据就复杂很多。
4. 数据挖掘知识图谱图片
知识图谱(Knowledge Graph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
思维导图,英文是The Mind Map,又叫心智导图,是表达发散性思维的有效图形思维工具,它简单却又很有效,是一种实用性的思维工具。
思维导图运用图文并重的技巧,把各级主题的关系用相互隶属与相关的层级图表现出来,把主题关键词与图像、颜色等建立记忆链接。思维导图充分运用左右脑的机能,利用记忆、阅读、思维的规律,协助人们在科学与艺术、逻辑与想象之间平衡发展,从而开启人类大脑的无限潜能。思维导图因此具有人类思维的强大功能。
5. 数据挖掘图表
不少研究生们可能都有这样的体会:千辛万苦得来的实验结果,不知道该如何展现给别人?的确如此,有些研究工作做得非常出色,可能由于呈现方式的问题,不能发表高水平的文章(尤其是SCI文章)。
仔细分析C-N-S系列的大牛文章,不难发现,这些高水平论文的图表质量也高人一筹。因此,合理的“包装”自己的实验结果非常重要。
一,共聚焦图片
1. 拍照时要保留大中小三个倍数的图,且图片分辨率不能太低(我们用1024*1024),能大则大,我们是因为机器限制。用的时候要进行裁减,比如文章上放的是200倍和400倍的图,实际上200倍的图来自拍照时100倍的图,400倍的图来自拍照时200倍的图。这样有利于准确地形成系列图片。
2. 图片对比度、中间色之类可以(或者是必须)在保证趋势的基础上进行适当调整。
3. 荧光图片不提倡定量,定量要配合western。
4. 应该是tif格式。
5. 拍照时一般不要把对比度调节的太大,尽量保存细节。拍的太强了后期是不好调弱的,或者背底太暗了也会丢失细节的。这些后期都可以通过软件调节。
6. 低倍-高倍的顺序。反之会形成暗区,特别是在高倍加zoom放大层扫之后特别明显。这是教训,不能看见高倍下面比较好的结果,就欣喜若狂,先高倍后低倍。
7. 一定要保留你的oib格式,不能因为省空间,只存留tif格式。有些杂志会要求伪色,比如,红色的用粉色显示,要是有oib格式就很好调整,重新出图就是。没有oib,用tif也可以用其他软件转换,但总觉得最后的颜色不是很对,因为很难把握粉色的色值。
8. 层扫的图片叠加或出2D的tif图,建议不要用“输出所见”这个选项,这样出来的1024-1024的会变成512-512,这时候还是选择一般tif,1024-1024,后期再用其他软件合成会比较好。
9. 结果好,拍照好,才是最基本的,一定要杜绝对结果的修改。对于形态学的图片来说,用软件修改后的用一些二进制的软件打开后可以明显看出修改过程。这是同学告诉我的,自己没试过,因为没这样修过。
二,幻灯片
实验室就非常强调你的汇报能力。幻灯片至少是要无懈可击。可能你的工作很漂亮,但是你做了一个很粗糙的幻灯,而且讲的也很粗糙,这样,别人对你的评价就会打折扣。我一般喜欢用prism作图,非常漂亮,而从来不用excel作图。而幻灯,思路要很明确,背景要介绍清楚。然后大家一定要控制时间,给你十五分钟,最好是留有10s的空余,但是一定不能多,也不能讲到十分钟就结束了。
三、图片
目前杂志投稿没有一个统一的标准比较麻烦,比如照片的DPI不同杂志要求就不一样,有的杂志甚至单独要求Merge图片的DPI,还有的连统计图的线粗细磅数也要求不一样。这就造成一稿被拒,还要重新治理很多照片和统计图,非常麻烦。
1. 首先对文章中图片的逻辑关系要十分清楚,针对results部分排好序,而且开始的时候要多准备一点图片,挑出几张拍摄效果好的,在投稿的时候,除了你认为最好的那张图以外,还可以放几张备选图到附件中。
2. 图片的排列一定要有逻辑性,不管是从大体形态到分子机制,还是从分子机制再到形态学,不管按照什么方式叙述,都要按照一定的逻辑顺序。
3. 图片要尽量的精美,而且要每组图片要保留几个备用的图片,以免要求修改时,找不到合适的图片。
4. 要注重细节,放在PPT上排列时,要注意上下左右的图片尽量对齐,包括用来放在柱形图上的小星号,一定要对齐,放好。
5. 代表趋势变化的图,一定要能看出趋势。不明显的图就不要放在上面了。
6. 如果是大体照片,比如关节炎肿胀的照片,要放一个尺在背景中,这样即使照片焦距不一样,有了尺的刻度在照片里,就很能说明问题(尺的刻度随照片大小改变而改变)。
7. 在excell中作的柱状图或线图,我一般都是用字体14号,字形加粗,线条粗细在1.75到2.0。
8. 当然大家想要得到精美图片掌握photoshop等作图软件是少不掉。
9. 几幅图如何排版,最好看看级别高的杂志,他们是如何排版的。
10. 每次都感叹老外的综述性文章的图片,看的很直观,这次我也发表了一篇综述性文章,找一个做动漫的高手,将我个人的想法在photoshop上画了一个精美的图片,故有时可以请专业人士帮忙。
11. 对于病理的图片,照相时要加标尺,一般用Tif保存,尽可能保存分辨率高的图片(以后再压缩都行)。我一般都是100倍的照1张,200倍的照4张,400倍的照4张。
12. 图片要在PPT或paper中呈现的时候,最好加一个边框,图片之间不要距离太宽,这样要好看些。
13. 组合图片时,一般用photoshop.注意细节,上下左右要对齐。每个图片的背景要调整一致。
14. 做统计图时,用origin,Prism,sigmaPlot。这样做出来的图确实要好看,而且容易调整间距,字体等。当然用EXCEL也能做出好看的图,但是需要仔细修改,比如要去除网格线。
15. 所有的图片最好符合黄金分割原理,长宽比例控制在1.6左右。图中重点强调的内容一定要加粗,或者用很醒目的符号。总之最能吸引人眼球的地方就是你文章最重要的部分。
16. 图片的英文字体最好用Arial。
四、图表
1. 完整性。图表应包含摘要中所有的重要结果,并且信息量要比摘要更丰富,这样才显得丰满。但也要注意别把所有结果都堆砌上去,这样反而会干扰文章的逻辑主线。
2. 逻辑性。实验结果不同部分的图表必须互相联系,形成一个连贯的逻辑链条,以支撑文章的结论。如果只看图表不看正文也能自然地得出结论的话,那说明其逻辑主线是非常清晰的。
3. 精炼的文字说明。配以文字说明,使得图表易读易懂,但一定要简洁精炼,否则还不如去看结果的文字部分呢。
4. 把握一些细节问题。比如图与图之间的间距以及字体的大小、位置应保持一致,图片中指示箭头与背景的对比要明显...等等。图表及文字说明的排布要力求整齐划一,给审稿人一个严谨的印象。
五、论文
1. 条理清晰:编号要有条理,可以所有的都不编号,也可以编成1,1.1,。。等等,但一定要前后一致。
2. 丰富多样:我认为一篇论文中应该有图有表,有的数据既可以以表格形式表示,也可以用Excel画出图,那么就应该看看文章中缺什么,比如图比较多,那就画个表,等等。
3. 对于文章的格式,有一些具体的要求:字体 (Font):Times New Roman,字体大小 (Font size):12 (即小四),行距 (Spacing):双行 (double space),纸张:8.5-by-11-inch (相当于A4),纸张边距 (Page margins):各留 1 inch。
4. 书写要求:右边不对齐 (do not justify the lines at the right margin),每段第一个单词嵌入1 inch (Tab键,或五个空格)。
5. 对于图,首先要写好Figure legends,“readers do NOT need to look at the text to find out what the figure means ”,所以Figure legends要叙述清楚。
6. 绘图工具:Photoshop or powerpoint
7. 图片大小:one-column or two-column
8. 字体选择:Helvetica or Arial
9. 如果数据比较多的时候尽量放到表里面,减少结果部分文字的篇幅,我有一篇文章审稿人就要求我把文字部分的数据放到表中。
10. 图中尽量多做标注,最好做到不看legend也能看懂图的内容。
11. 图的数量不宜太多,不重要的图不必显示。
12. 示意图宜简单明了,无关的东西不需要
六、如何做免疫组化的图
免疫组化做完后就要进行目的蛋白表达水平的评估,就是读片的过程,期间可以留意哪些染色具有代表性,可以作为文章中的图,用显微镜拍好后,接下来就是如何将这些代表性的图(如weak,moderate, stong staining)合成一张图。
1.将不同的图同时用Photoshop打开,同时新建一张背景图。
.考虑到美观,可以采用圆形选择工具,比如直径为2cm,在每张图上进行选择,将选好的区域拉到新建的背景图上。
3.注意各个图之间要对齐,可以采用参考线进行对齐或将不同图层进行链接,然后再对齐。
4.根据不同杂志的具体要求,设置图的大小及分辨率(DPI)。
七、作图软件
老板曾经给我说过,一定要十分注意自己放到文章里的图片,好的图片更容易让编辑对你的文章产生好感;而且,不完善的图片一旦发表,它是永远不能被撤下来的。过一段时间,你自己看着就很难受。
我以前习惯于用excel作图,老板已经不允许了,现在全部换成graphpad prism 5 和canvas 11了,刚开始的时候,用着这两个英文软件也不是很顺手,用久了,果然发现这两个软件作出的图片和图表的确质量要好很多,而且,再次改起来也很方便。graphpad prism 5还可以直接做统计分析。至于图片的初级处理工作,一般都是在image j和photoshop里做的。image j是个功能很强大的软件,可以在网上免费下载自己需要的插件,完成自己特定的要求。
互相交流,共同进步。
确实如此,作图软件也是影响图片质量和作图效率的一个关键因素。作图软件(或者统计软件)往往因各人的习惯和实验数据的特点而异。
就我个人而言,我的实验数据大都是电生理和形态学方面的东西,我觉得比较合适的软件是:
1.电生理:Igor 4.0; miniAnalysis; Plusfit;
2.形态学:photoshop;IPP
3.统计软件:spss,excel(一些简单的数据分析还是很实用的)
的确如此,写文章过程中需要的主要软件工具。关于实验方面的,不同专业要求不一样。在这儿我想说的是,从原始数据到文章成稿的过程中,你可能用到的软件工具:文字的(e.g. Word )、图形的(e.g. Origin, sigmaPlot,photoshop)、数据分析统计的(e.g. Excel, SPSS or SAS…)、数据模拟 的(e.g. MathCad, Matlab…)、文献管理的(e.g. Endnote…)及其专业软件。
在这过程中,图片的处理尤为重要!您想让自己的图片在文章中看起来更清晰,为您的文章增添更多吸引人的地方除掉软件以外你的 Tables, Figure captions, and Figures, 还应具有科学性、新颖性和逻辑性,有时候可观赏性很重要。
在英文综述性文章中,用示意图能很好将复杂问题简单化!需要一定的作图功底能力。
个人觉得大家在作图时,不要太迷信用专业的作图软件,现有的常规软件word、ppt,只要你用心转研,一样可以做出精美的示意图。我之前在一次会议的时候看到一个高手做的示意图,很是漂亮,下来一问,居然是用ppt做的,回来一试,果不其然,自己也能做出很漂亮的彩图,这次直接在国基中派上用场。希望大家能够好好发掘现有的软件和素材,小块头也有大智慧,呵呵!
八、采集原始结果的原则和方法
稿件中的图片大体可以分为三类:1)来自数码相机,如显微镜下或大体照片等;2)来自采样软件,如powerlab的动作电位图、血压图等;3)来自统计作图软件,如Excel的柱状图等。
操作的三大原则:1)原始图像要保留,修改后的图像务必另存而不要覆盖原始图像;2)尽量减少保存次数,以免损失图像质量,可以多处修改,一一完毕后再做存盘;3)所有操作不得使图像失真,任何影响图像真实性的修改都是不允许的。
任何修改工作都是在原始图像的基础上进行,所以如果原始图像质量不佳,那必将事倍功半。下面对有利于原始图像质量的细节略做介绍。不同来源的图像,其注意点也不一样,因此分开讨论。
1)来自照相的 获得的数码文件多是在显微镜视野下采集的,因此聚焦和暴光是必须要考虑的。显微镜下景深极浅,意味着聚焦清晰不能依赖于小光圈,而应靠精细调节显微镜。注意应使照相通道和目镜观察通道相一致,即目镜下最清晰时拍照也最清晰。拍照时相机应选择最大光圈,广角端。不要使用望远变焦,它使得视野变小且放大倍数难以计算。聚焦不清的另一主要问题在于相机的抖动。虽然一般相机都固定在显微镜上,但按快门时的手震有时仍不可忽视,这时一个简单的办法是利用相机的自拍功能,按下快门之后经倒数计时后正式拍摄。暴光时间的选择在一般的明视野下可由相机的自动暴光决定;而暗视野下有时需要高达几分钟的暴光时间,这是一般数码相机达不到的,只能通过专业的CCD系统并用软件帮助采集图像。一些软件可以用来修改暴光不足的照片,但暴光过度往往使图像细节丢失。显微镜下拍摄时闪光灯不起作用,将它关闭。通过白平衡,一般不会产生严重的偏色。另外,由于镜头的原因,边角处难免会有失真,因此,请保证目标在视野正中,镜头成像最佳范围内,而无须铺满整个视野,现在的数码相机的像素值已经足够高了。
2)来自采样软件的 采样软件所采得的原始图形一般储存在特定格式的文件中,通过该软件或配套的分析软件打开。有的采样或分析软件可以将图形直接输出到Word或Photoshop中,但有的则不能。这时最简单的办法就是通过抓屏或抓图软件来获取。通过采样软件获取的图形输出后仅做些切割、拼合的工作,不应该做更多其它的修改。图形在采样软件中可以通过改变x轴和y轴的缩放比改变形状,因此一组图片应该选择统一的标准,并且标注x, y轴的标尺。图形的精细程度和采样频率相关,采样频率越高,图片越精细。图片中不必要的颜色信息可以在Photoshop中丢弃。
3)来自统计作图软件的 常用的统计作图软件包括Origin、Sigmaplot、Excel等。这些软件作的图一般都可直接输出到Word及Photoshop中。统计图的标注等应多在统计软件中完成,输出后不宜多做修改。图中尽量不要用颜色或灰度来区别组间,而多利用形状特征。如Excel的柱状图,选择“填充/图案”,里面有足够多的选择项。
九、生存曲线的作图方法
可以来做生成曲线的软件很多,比如SAS,STATA,SPSS等。这里以SPSS为例,介绍生存曲线的做法。
1)分别将随访天数(TIME),结局变量(YES or NO),不同分组及处理方式(TREAT)输入软件。激活Statistics菜单选Survival中的Kaplan-Meier...项,弹出Kaplan-Meier对话框。将各个数值输入对应的对话框中,再点击OK钮即完成分析。
2)对软件生成的生存曲线,可以进行手动编辑,双击需要调整的曲线,可以选择合适的风格(style)及颜色(color)。
3)将图像用photoshop打开,选择文字工具,给图像加上标题、副标题及坐标值说明。标题及副标题字体为Arial, 12号,其他字体均为Arial, 8号。
4)采用各种选择工具(如矩形选择工具)来调整图像中不同标题及坐标的相对位置。
5)根据需要选择合适的分辨率,一般为300(DPI)。这是我做的一张生存曲线图。
6. 知识图谱 数据仓库
有大厂再用的
GitHub于2008年4月10日正式上线,除了Git代码仓库托管及基本的Web管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。目前,其注册用户已经超过350万,托管版本数量也是非常之多,其中不乏知名开源项目Ruby on Rails、jQuery、python等。
2018年6月4日,微软宣布,通过75亿美元的股票交易收购代码托管平台GitHub