企业采用云计算最引人注目的优势之一就是不再为那些底层硬件所困扰,可以在任何地方或任何时候使用虚拟机,更好地为业务服务。企业不再需要通过预估来确定能够满足未来需求的CPU,内存,硬盘的数量。如果预测不成功,也不需要受到这些决定的约束。内部IT团队不再需要安装和维护这些基础架构。
相反,使用云计算中的虚拟机,以往数据中心的硬件的细节可以通过简单的点击就容易地改变。这个过程可以满足不断变化的需求或优化系统。通常,小变化就可能提供巨大的性能改进,但如果它意味着需要繁琐的物理硬件安装,企业就不会尝试。通过这种方式,云计算提供了业务处理能力和灵活性,否则将无法使用。所以,大多数人总结采用云计算是一个很好的选择。
云计算服务提供商DreamHost公司选择采用硬件,而让用户不必直接采用硬件。或者换句话说,云计算服务提供商没有这么幸运。所有这些虚拟机必须在物理硬件上运行在某个水平,DreamHost公司一直在努力确定应该在数据中心中采用哪些硬件。由于最初通过其第一个OpenStack实现(DreamHost Cloud Beta集群),采用者的业务开始采用云计算服务,云计算服务提供商必须十分了解数据中心硬件,才能更好地满足用户的需求。
DreamHost公司决定采用的Dream Compute Beta集群应该使用哪个硬件,并设计后端云基础架构,为企业用户提供虚拟机,同时在其软件限制范围内工作,需要做出一系列选择。并在它发生时,找出什么会更好,然后适应。客户的反馈会为云计算服务修正错误。
以下是为云计算产品寻求合适的硬件组合时所学到的要点:
1.测试限制(然后坚持)
云计算厂商需要知道可以或不能改变什么。在构建云计算集群时,这一点证明是正确的。云计算厂商开始突破某些不变的物理和基于软件的限制。数据中心的机架9英尺(58U)高,并部署了两个60A三相208伏电源板,这是基本的物理基础设施。这个OpenStack实现的操作系统软件是主机上的Ubuntu Linux和交换机上的Cumulus Linux,因此云计算厂商只能使用与Linux兼容的硬件。
此外,作为一个业务问题,客户对CPU,内存,磁盘等使用的需求保持在一定的恒定比率。云计算厂商可以改变其产品和定价,但必须采用一定的比率,这将成为一个硬限制。
2.加强核心:数量或质量?
对于Dream Compute Beta集群,云计算厂商使用AMD皓龙6200系列处理器,为每台机器提供令人印象深刻的64个CPU。其唯一的缺点是,相对于其他选项运行缓慢并功率不足。大量的CPU允许在单个主机上部署大量的虚拟机,并提供优秀的规格,虚拟机的配置大约为32个CPU,64GBRAM。虽然客户肯定喜欢有很多CPU,但是市场反馈比较冷淡,因为拥有更强大的CPU对客户于的需求更加重要。经验教训:在下一个集群的设计中,云计算厂商在平衡CPU功耗和数量方面要仔细考虑。
3.服务器的电源问题
说到电源问题,每个虚拟机管理程序机器中的CPU和内存的密度(加上在每个机箱上安装的两个系统的设置)创建了一种情况,其中服务器无法使用单根电源线运行,但需要两个1600W电源。因此,不可能在这个系统中建立冗余,这样的管理程序没有弹性。在遇到维护事件,电源波动,PDU故障等情况下,它们都会掉电,并使这种情况更糟糕,机器附带的电源电缆的C13连接器很小,因此它们很容易从PDU上的插座中滑出。
这反过来意味着管理程序也将失去电力。对于新的集群来说,云计算厂商必须在电力冗余的硬件方面进行投资。
4.选择硬件时,不要群集存储群集
当涉及到Dream Compute Beta集群的构建块存储时,DreamHost公司使用了最初在DreamHost开发的对象存储软件Ceph。当时,唯一的参考点是使用什么样的硬件,大型对象存储集群Dream Objects,所以云计算厂商将相同类型的专用存储设备到位。
事实证明,大型对象存储集群和云计算存储集群有不同的需求。大型对象存储集群旨在保存大量未经常访问的数据,因此可以使用低端处理器,少量RAM和简单的RAID卡。相比之下,OpenStack云的数据后端需要能够处理各种并发和正在进行的进程:虚拟机向上或向下运行,MySQL正在执行操作等。DreamHost公司再次面临一个平衡问题:实际需要的存储空间接近10倍,性能表现不佳。
最后,试验,错误,挫折,客户反馈,知情改进的迭代过程使云计算有合适的硬件。如何在硬件功能之间在电源和广度之间取得适当平衡的教训,并逐渐提高了产品的质量。
好文章,需要你的鼓励
OpenAI明确表示要成为互联网一切事物的主导界面。AI智能体正在改变用户的数字习惯,从健康记录分析到购物指导,ChatGPT已经在多个领域扩展影响力。用户快速采用AI工具,但企业和生态系统的适应速度滞后。电商领域的权力分配尚不明确,用户偏好AI驱动的答案优先体验,品牌则推动生成式引擎优化。研究旨在了解用户与企业在AI变革中的适应差异。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。